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1 Hintergrund der Erfindung 

Die vorKegende Erfindung betrifft ein Verfahren gemafi dem Oberbeeriff des Ansnmchs l 

beScTv Wndungen fiir Datenverarbeitung und Datenaaalyse Femer 

t,2^nhr^ff^'* Oberbegriffen der Anspruche 6 und 7 zur DatSverS 

^^unTSr J:;*>S?itod^^^ -"--^-^^ Da^eitungseinric^tt. 
un«?iSr^^ <iie hierbei A^endeten Konzepte von einer spezifischen ModeUvorsteUunE 
miabhangig smd. ist es fiir das Verstandnis der vorKegenden Erfindung nflST S 
motMSern-"!? T^^^S-^- Begriffen aus dem l4hgebiet d^ SroS^SLttTz; 
• •f-^'*'""^ ^T^"" anschauUche Interpretationen im HinbSaxrf ,Se 

LerndynamJc m neuronalen Netzwerken geschaffen werd^. 

ver^^r^tT2!u3t ^ ^^'^gige Standardwerke 

Grl^b^^ff'^^,?! Verstandnis topologieerhaltender AbbUdungen ist es niitzUch auf 
s^tXfg^fC^^^rZ^^^^^^^ Vektor^u^isierun/auf^bauen. Die b^^ 

1.1 Vektorquantisierung 

steuSSnl'%^t' reprasentieren, wobei 'geeignet' im HinbHck auf spezdfische Zielvor- 
n ^*^5^f li^e Weise definiert werden kann. TVpischei^eisr^d Se ^ 
l1^^Z t S^debufr^J^^e" wesentKch kleiner gewahlt als^e Anz^ ticTr Dat^" 

rf.r^,''p''1rf schematisdi ein neuronajes Ncte als Model! far dnen VcktormiMti 

ucu ^iviiaTen a;<, i e |i, , . . , „} zugrunde, so reprasentiert das 
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Eingabesignale 




i = 1, . . . ,n 



Aktivierungen 
%(x) j = 



Abbndung 1: Schematische Stniktur eines Vektorquant 



isierers. 



A^vitatost^ auf der Ezngabeschicht einen Datenpunkt x im sogenannten Merkmats- 

Aktmtat auf die N ZeUen der A«.pa6«cfeicA« fortgeleitet. Diese ZeUen der Ausgabeschicht 
entsprechen den Codebuchneuronen. Die Verbindungsgewichte - d. h. ira neuronalen Bild 
- ^e Synapsenstaxk^ w, € R", j€{l,...,N} werden hierb« so gewahlt, daJ3 die Akti- 
vitat a,- ernes Ausgabeschichtneurons j in geeigneter Weise von der Distanz rf = llx - w H 
des Datenpunkte x vom virtuellen Ort w, des Codebiachneurons j abhSngt. d definiert 
dabei em beliebiges Distanzmafi im MerkmalsraTim. Der Begriff „virtueUer Ort« basiert 
hierbei auf der VorsteDung. dafi die Aktivitat des Codebuchneurons fur ow ^ w,- ih- 
ren Maoomalwert amiehmen soU, was als „SperiaJisienmg« des Neurons j auf dS Ort w 
mterpretiert werden kaim. ucu vxu Jtmax 

A..^-^- ^J'Sesdilossenem fining des Vektorqua^tisierers kann ein Eingabesignal x 
durch dae Aktivienmgen a^(x) der Codebuchneuronen 3 reprasentiert werd£i, woS die 
Verbmdungsgewichte des Codebuclmeurons 3 zur Eingabeschicht zum Codebuc^^or 
Wj- zusammengefaSt werden konnen. uBuuuuveiu,or 

i"^'"^ aUgemein als iterative, sequentielle Lemvorgange 
^^^en^eren. Hierbei wird zunadist die AnzaM N der Codebuchvektoren w/fesl 
l^SL^t ^? Tfr'' ""*^^^5*- ^ wird typischerweise jeweUs ein Da. 

"^eLM^r'^"^' Codebuchvektoren na^ der ^Igemeinen, 

w,(t + 1) = w^(t) + e(t) X, C) (x(i) - w,(t)) (1) 

aktuali^iert. t bezeidmet den AktuaJisierungsschritt, e einen frei wahlbaren Lemparameter 

St forS^^rX'iT A^r^'r*^^*''^ Lempaxa^eter e wird typischerweise 

mit fortS(ireitendem Aktuahsierungsschritt monoton faUend gewahlt. Aufgrund von Ana. 
logien zu Systemen der statistischen Physik wird dies haufig als „Abkuhlung« bezeichnet 
Vielfa<di wird erne exponentielle Abkiihlungsstrategie verwLdet: oezeicnnet. 



e(*) = e(0)(^) 



<e [0,tniax]. 



(2) 
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^(t,x,C):=J..(,j,^ (3) 
aus, wobei t(x) aus dem minimaleii Abstand 

||x-Wi|| = min||x- w,-|| 
Lemregel. '''msclmtt talmnmt, spncht mao auch von einer tBinner-JoiM-oJi- 

1.2 Selbstorganisierende Karten 

Kooperativitatsfunktion Ti^^leitto^ fl W,^ h Bezugsraumes der Metrik, die der 
selbstorKanisierendS • u^^i^ zugrundegelegt wird. Beim Algorithmus der 

z, B. als Raum der 'Dhu^ihnlixtnh^^ o^..*-^ ^icieiiuen ixaxten lafit sicn der Zielraxim 
gemafi einerTbbMmg J"""*"^ r, der Codebnctaeuionen j mterprelieren 

r:]N-»H«, j rO). 
^ S ^SSS^t ^bS"^'" ^^"'^'^ der .elbatorganwerenden Kaxte 



von^^dL^Slf be^dmet. Ein typischer F^l ist beispielBweise die Anordnung 
so A - ?^Po™ rr"^ auf emem zweidimensionalen diskreten periodischen Gitter (J 
sou ^^'^^Of^^ Karte. die den Input von n SinneszeUen reprasentieren 

sou Hierai gibt es zahlreidie biologische Vorbilder, z.B. die retinotope Proiektion von 
H u 7i [12]. Kohonen fand nun eiie Heuristik^^rdi «Se N^onen 

l^^'^^T^T" ^-Pff^^iJ Eingabesignale x so'xniteii^dS abs~ 
JconnM^ dafi ihr Ansprechverhalten auf Signalmerkmale in gesetzmafiieer Weise mit ih 
rem Ort auf dem ModeUcortex variiert" (frei zitiert nach [36]). Zur nIXphysSloScht 
Motivation some zar mathematischen Definition sei auf [36] verwiesen P^^'^^'^^^^^^" 
Der physiteJische Ort r der Codebuchneuronen bestimmt hierbei die Metrik fiir die 
Kooperativitatsfunktion ^. Deren konkrete WaM aJs Gaufifunktion 

^(r,r'(x(t)).a(t)):=exp(-(l:^|p!). 
Oder etwa als charakteristische Punktion auf einer A>-dimensionalen Hyperkugel um r'(x(t)) 
^(.r'Cx,)),.,)):^,,,.^^^^^^^^^^^^^ : Izt^t:^ (7) 

m'^^^'"*''""''"'*^^ ^^-^ bei gegebenem 

||x-wr.|j = nmi||x-wr|| (g) 

das Neuron mit der hochsten Aktivitat, das sogenannte ..Gewinnemeuron" Zur Kenn 
z«chnung ernes Codebuchneurons wird hier direkt sein ph^sikalischer Ort^mSTdSX 
bUdung (5) benfltzt. Die Lernregel (1) wird somit zu S«°^«^ Ab- 

wr (t + 1) = w,(t) + e(t) ^(r, r'(x(t)), a(t)) (x(t) - w,(t)). (9) 

W ^^7^ entsprechenden Kooperativitatspaxameter aus Gleichung f6) 

Lrtei iad ;S t 'V^^^^-"«" NachbaZaftsfunktion ^ uf SiSl 

cortex und wird 1. a. wahrend des Lemverfahrens ebenso wie der LernDaramet<»r r,a..l, 
emer geeigneten Heuristik verSndert, z. B. analog zu GleiXng (2) 

.(*) = .(0)(f^)^ ,,jO.W]. (10) 

"^T^s Defimtionen kann das liraining einer selbstorganisierenden Karte in Anleh 
nung an [36] folgendermafien aJs technischer Verfy^renslblauf b^Sn^rel werdS 

(i) Ljitialisierung: Wahle geeignete Anfangswerte fiir die Godebuchvektoren w In 
Ab^esenhext n:gendwelcher a-priori-Infonnation konnen die z. B. ^^^^^mt 
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m^^'"^' "^^^ zufallig einen Vektor x der eingegebenen Daten ixn Merk- 

(iii) Itesponse: Bestimme das Gewiimenieuron gemSfl Gleichung (8). 

(iv) Adaptationsschritt: Piihre einen Adaptationsschritt durch Veranderung der Co 
debuchvektoren durch gemSfi Gleichung (9). veranaenmg der Co- 

eSLr "^'^^"^^^^^ ^« Schritte (ii) - (W). bis ein geeignetes Abbruchkriterium 

Zu weiteren Details der selbstorganisierenden Karten sei auf [361 verwiesen deren 
Offenbarung hiemnt durch BezugnaJune in die vorliegende Anmeidi^^ a^^^^'S! 

2 DetaiUierte Beschreibung der Erfindung, Teil I 

D^^S ^^^J"^^;^^ Aufgabe zugrunde, Datenveraxbeitungen zu verbessem 
7, I?ld1? ^"'^^'^ ''^^ Gegenstanden d^ A^m^Trs] 

scJ£T Ausgestaltungen der Erfindung sind in den Untera^priichen be- 

Sal^orSL^i^ K^hi^^^^^^ Berechnungsverfahren berechnet: Levenkein-Mafi. 

dJZ ^^^bdl^gseinii^ gerichteten Patentanspruch wird erwahnt 

benaienden «.aMen..,e. etc., iST^^ j^lSttg^nSf "'"^ 



dafi unter dem Begrtf "Computerprogrammprodukt" ein Computerprogramm Oder Com- 
put^rograonm-Modul zu verstehen ist, welches durch Speidieru^g fzyxm Beis^id a^ 
iTf^^ ^.^^^^ Speichermedimn oder in einem fluchtigen oder nfcht-fluchtig^ K^t 
leiterspeicher ernes Computers) oder durch Signale, die uber ein Netzwerk. insbesonder^ 
das Internet, versendet werden. verkorpert ist. Dabei braucht das Comp;terpr^a^ 
Sfl In^^^'T" ausfuhrbaxen Form vorUegen. viehnehr kann ^ aS if 2^ 

^b^P^t?^; i^^^ vorbereiteten Form existieren, 

Newlt^! W ? ^ ^"5"^' l^^'^^^Jt. ^ eine etwaige Versendung uber eiii 
zerteut und mit iibertragungsbezogenen Headem versehen sein kann, 

^ih^nH^^"^""! Zi^'^ Merkmale mid VorteUe der Erfindung werden numnehr 
anhand bevorzugter Ausfuhrungsbeispiele naher erlautert 

fiH^It'^l"^^ in grobai Ziigen der Aufbau eines Computersystems als spezieUes Aus- 
fahnmg^bexspiel emer Datenverarbeitungseinrichtmig erlautert In der Regd u^fS 
solch^Computersystem einen Computer mit einem Monitor, einer EinSa^ u^d 

l^^i ^T^' Projektor, verwendet werden. Anstelle der Computermaus konnen ew! 
Sc^ pS' ^I'^M Cursorpositionierungsmittel, wie beispie Jeise ein Track-BXSi 
SltS^^eMe^""'*^^' ^-^-S-- P^eilt-ten einer Computertast'atur 
Der Computer weist einen ersten Datenspeicher in Form eines Plattenspeichers auf 
^^^u^'uZTt'lX''^ Oder Diskette, und einen zweiten DatenspeSr i^ F^^ 
em^ Haupt- und/oder Arbeitsspeichers. Zwischen dem Flatten- und dem Arbeitsspeicher 
T^Z i^ "^'*"r- o " erfolgt beispielsweise iiber iibliche sS^d- 

rr.nTr«l P ^"^'-rP'^^r Veraxbeitung von Daten erfolgt uber eine CPU 

(Central Processing Umt). Auf dem Plattenspeicher werden Daten ge^eichert aii die 
der Computer uber entsprechende Kontrollmittel zugreifen kann. D^Smpu^ ^t 
Zdli^pr^'^'lT"^'' beispielsweise mit einem zweiten ComTutT^* 

e^b^ Z STf- ^ sogenanntes Modem umfassenf mit dL 

In Z^^v T n'''''^ ''"'f" entsprechenden Provider mit dem Inteme verbun- 
den werden kann Der Computer kann auch Teil einer direkten PC-Verbindung. weite^ 
Computer ernes Computer- Clusters oder Server eines Netzwerks sein. 

2.1 VeraUgemeinerte Sichtweise topologieerhaltender Abbildim- 
gen 

^''f^f^^S'^?^''^^'?"'*^^ wesentlichen Begriffe werden im folgenden definiert: 
Een^SSb?^ if " F'^^^^^-^^^beitung durch sog. 'topologieerhaltende AbbUdmi- 
gen Hierbffl handelt es sich urn unterschiedUche, dem Stand der Technik entsprechende 
Datenveraxbeitungsverfeliren. Wichtige Beispiele sind: Selbstorganisier^drK^ (Setf! 
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of Proximitv Data rqT^/rp^^ ^ A^ ■ ''^''PP^f ^&iMKj, Soft Topographic Mapping 

2.1.1 Allgemeine Definitionen 

^' ?fvoi?-'^r;^^!!^^^^^^*^°^^j«^^^ Menken Zah 

len, Vektoren, Graphen, Svmbole TtextP RiMor. Qi«^ i , ®"Sen, z,ah- 

ffPTi iiT,/i /I.. Jr. D ~ '^yiQDoie, iexte, hJUder, Signale, mathematische Abbildim- 

^ ^"S!^^^ D^tenobJ*^. B. aud. ode, Obannenge einer 
2-1.2 Punktionelle Definitionen 

den. etwJS*^ ^^'^'f'''^'"'^''''"* 'G^benes, nut 
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Ehagabedaten beemfluSt. jedooh nldit vdlstSndig besttaLT^. 

ten der Hypothese). wobd das VerhStato der Anzabl der GitteSiotrfeT; 
dS^SZt °°'"J^*'' BertcWchtigung des Verbal te?Sutgt 

S^f,Sl„r^ , ^=^"t"'"S Wden groBten Eigenwite im Ilihmen 



• Ausgabedaten: ffierbei handelt es sidi Tun Datenobjekte, die als Ergebnis der 
Veraxbeitung der Eingabedaten durch die topologieerhaltende Abbildung gewertet 
werden. Dies sind l^^isdierweise 

(i) C5odebuchobjekte iind daxaus beredmete GrSBen, Definition aehe imten 

(ii) Strukturhypothesen, die durch Codebuchobjekte oder daraus beredmete Gro- 
fien motiviert sind 

Ausgabedaten sind keineswegs nur Codebudiobjekte oder Strukturhypothesen nadi 
vollstandig abgesdilo^enem Training einer topologieerhaltenden Abbildung, son- 
dem konnen einem beUebigen "Brainingsstadium der topologieerhaltenden Abbildung 
entspredien. 

2.1.3 Strukturelle Definitionen 

• Erkundungsraum: Raum der Menge von Datenobjekten, mit denen die topolo- 
gieerhaltende Abbildung trainiert wird, d. h. die prasentiert werden, d. h. die in die 
Beredmungsvorsdurift der topologieerhaltenden Abbildung eingesetzt werden, urn 
die Codebudiobjekte zu beredmen (z. B. x in Absdinitt 1.2). Diese Datenobjekte 
werden im folgenden Erkundungsobjekte genannt und aus dem Stand der Tedmik 
bedingten historisdien Gninden audi synonym als Merfsmalsvektoren bezeichnet. 
Man beadite, da6 diese Datenobjekte gemaB Stand der Tedinik den Eingabeda. 
ten der topologieerhaltenden Abbildung entspredien. Ein wesentlidier Aspekt der 
Erfindung ist, dafi diese Bntsprediung aufgehoben wird. 

• Anordnungsraum: Raum der Menge von Datenobjekten, die topologisdie Zusam- 
menhange definieren, wobei diese Zusammenhange fur die Beredinung der Ausgabe- 
daten der topologieerhaltenden Abbildung beniitzt werden, z. B. im Rahmen einer 
Kooperativitatsfunktion gemafi Gleidiung 9. Ein widitiges Bdspiel eines Anord- 
nungsraumes ist der ModeUcortex beim Kohonen-Algorithmus, audi Gitter- oder 
Indexraum genannt. Die Datenobjekte des Anordnungsraumes werden im folgen- 
den als Anordnungsobjekte oder Neuronen bezeidmet. GemaB dem Stand der 
Tedmik handdt es sidi hierbei um Vektoren in metrisdien Raumen. Diese werden 
aus dem Stand der Tedmik bedingten historisdien Griinden im folgenden audi aJs 
GfiUervektoren oder Positionsvektoren bezeidinet. Ein weiterer widitiger Teilaspekt 
der Erfindung ist die VeraUgemeinerung des Begriflfe der Anordnungsobjekte auf 
beUebige Datenobjekte, z. B. Distanzobjekte zwisdien Datenobjekten (Definition 
des Begriffis Distanzobjekt siehe unten). Man beadite, dafl gemaB Stand der Tedmik 
die Datenobjekte des Anordnungsraumes durdh Strukturhypothesen bestimmt wer- 
den. Ein wesentUdier Aspekt der Erfindung ist, dafi diese Entsprediung aufgehoben 
wird. Um die Begriffe Anordnungsraum und Erkundungsraum zweifelsfrei abzugren- 
zen, werden in Absdinitt 2.3 die bei versdiiedenen in der Literatur besdiriebenen 
topologieerhaltenden Abbildungen getroffenen Festsetzungen aufgefuhrt. 
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• Ehrgebnisraum: Raxim der Menge von Datenobjekten, die als Ergebnis der Verar- 
beitung der Bingabedaten gewertet werden (z. B. Godebuchvektoren einer sdbstor- 
ganisierenden Karte). Diese wrarden im folgenden als Codebuchobjekte bezeidmet. 

Hierbei mufi es sich nicht unbedingt um unterschiedliche RJLume handelB. So oit- 
spricht beispielsweise der Ergebnisravun vielfach dem Erkundungsraum: Bei der selbstor- 
ganisierenden Karte nawh Abschnitt 1.2 ist dies der FaU. ffier entstammen die Merk- 
malsvektoren i. a. dem gleichen Raum wie die Godebuchvektoren. Bin Gegenbeispid 
ware beim Clustering von Beobachtungsfolgen durch ffidden-Markov-Modelle denkbar 
(z. B. [34]): Hier konnen beispielsweise einzelnen Codebuchobjekten spezifische ffidden- 
Markov-Modelle entsprechen, den Erkundungsobjekten jedoch die Beobachtimgsfolgen. 
Als weiteres Beispiel kann auch der Anordnungsraum implizit aus dem Ergebnisramn 
definiert sein, z. B. als Ordnungsmetrik beim Neural-Gas-Algorithmus. 

Die zentrale Motivation fiir die vorliegeride Erfindung basiert nun auf einer Entflech- 
tung der oben aufgefShrten funktionellen und strukturdlen Merkmale topohgieerhaltender 
Abbildungen: 

Entscheidend ist hierbei, dafi gemSfi dem Stand der Tedmik die Eingabedaten Erkun- 
dungsobjekte sind, also dem Erkundungsraum OTitnommen werden und nicht Datenob- 
jekte des Anordnungsraums definieren. Des weiteren beeinflussen die Strukturhypothesen 
den Anordnungsraum und nicht den Erkundungsraum. GemaB Stand der Technik ist al- 
so den Eingabedaten der Erkundungsraum zugeordnet wad den Strukturhypothesen der 
Anordnungsraum. 

Kemgedanke der erkundungsgefugten Gestaltbildung (exploration Organized Mor- 
phogenesis, XOM) ist nun die teilweise Umkehrung dieser Zuordnungen: 

XOM-Definition: Verfahren und Vorrichtung zur Datenverarbeitung durch topolo- 
gieerhaltende AbbUdungen, wobei im Gegensatz zum Stand der Technik sowohl der An- 
ordnungsraum ab auch der Erkundungsraum beliebig durch Eingabedaten oder Strukturhy- 
pothesen bestinmit werden kSnnen. Insbesondere kSnnen im Gegensatz zum Stand der 
Technik Eingabedaten Datenobjekte des Anordnungraumes bestimmen, umgekehrt StnUe- 
turhypothesen Datenobjekte des Erkundungsraumes bestimmen. 

Die Aussage, dafi Eingabedaten Datenobjekte des Anordnungsraumes "bestimmen", 
bedeutet hierbei, dafi es ein Berechnungsverfahren gibt, mit dem Datenobjekte des Anord- 
nungsraumes aus Eingabedaten ohne Ruckgriff auf Strukturhypothesen berechnet werden 
konnen. 

Die Aussage, dafi Strukturhypothesen Datenobjekte des Erkundungsraumes "bestim- 
men", bedeutet, dafi es kein Berechnungsverfahren gibt, mit dem diese Datenobjekte ohne 
Ruckgriff auf Strukturhypothesen aus Eingabedaten berechnet werden konnen. 

Im Gegensatz zum Stand der Technik unterliegt die Wahl des Erkundungsraumes kei- 
nen Beschrankungen insofem, als es es sich bei seinen Datenobjekten neben Eingabedaten 
auch um Strukturhypothesen handeki kann. Umgekehrt unterliegt auch im Gegensatz zum 
Stand der Technik die Wahl des Anordnungsraumes keinen Beschrankungen, als es sich bei 
seinen Datenobjekten neben Strukturhypothesen auch um Eingabedaten handeki kann! 
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Im Gegensate zum Stand der Tfedinik kann also den Eingabedaten der Anordnungs- 
raum und den Strukturhypothesen der Erkundungsraum zugeordnet werden 

Em besonderer Aspekt der Erfindung besteht zusatzlich in der VeraUgemeinerung 
des oben definierten Begrife der Anordnungsobjekte iiber die dem Stand der Tedmik 
mtsprediende Interpretation als Vektoren in metrischen Raumen hinaus auf beliebige 
Datenobjekte, insbesondere auf Distanzobjekte zwischen Datenobjekten. 

Distanzobjekte and hierbei definiert als Datenobjekte, die AhnUchkeitsbeziehungen 
bzw. D^taj^en z^^chen Datenobjekten gemaS einem beUebigen Distanzmafi chara3d:eri- 
aeren aerbei smd sowohl durch Metriken induzierte Distanzmafie als auch insbesondere 
durch bdiebige, mcht einer Metrik geniigenden, DistanzmaBe definierte AhnUchkeitsbezie- 
hungen bzw Dissimilaritaten eingeschlossen. Einige typische DistanzmaBe auf der Basis 
von Dissumlaxitaten sind z B. in [19] aufgefuhrt. Metrik wird hierbei in mathematischem 
Smne definiert, siehe z. B. [5]. 

Zusamm^fessend ergibt sich also als Abgrenzung vom Stand der Technik mit obigen 
Demutionen folgende 

2.2 Technische Beschreibung 

Das erfindungsgemafie Verfaliren (XOM) fur die Abbildung von zu veraibeitenden Einga- 
bedaten auf Ausgabedaten umfaBt die folgenden Schritte: 

Die zu verarbeitenden Datenobjekte werden als Eingabedaten eingegeben. 

Die eingegebenen Datenobjekte werden mit Hilfe einer topologieerhaltenden AbbU- 
dung verarbeitet. Dabei werden 

Neuronen im Anordnungsraum angeordnet, indem gemafi einer ersten Alternative 
zunundest em Teil der eingegebenen Datenobjekte verwendet wird, um die Anord- 
nung von Neuronen im Anordnungsraum festzulegen. 

miterhin werden dabei den Neuronen Godebuchobjekte im Ergebnisraum zugeord- 

Sdiliefilich werden dabei Godebuchobjekte verarbeitet gemafi der Berechnungsvor- 
schrrft emer topologieerhaltenden AbbUdung unter Verwendung von Datenobjekten 
h,rkundungsraumes (siehe beispielsweise den in der Beschreibungseinleitung auf- 
^hrten tedinischen Verfahrensablauf fiir das Training einer selbstorganisierJiden 
Karte m Abschmtt 1.2). 

Gemafi &n& zweiten Alternative werden dabei als Datenobjekte des Erkundungs- 
raums von den zu verarbeitenden Eingabedaten unabhangig eingegebene Datenob- 
jelrte (Strukturhypothesen) verwendet. Die erste und die zweite Alternative konnen 
emzein Oder kombiniert angewandt werden. 
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Letztendlich werden die veraibeiteten Codebuchobjekte als Ausgabedaten ausgege- 



2.3 Beispiele der XOM-Definition fiir einige topologieerhalten- 
de Abbildiingen 

Die oben defimerte XOM-Definition sei fur einige in der Literatur beschriebene topolo- 
gieerhaltende Abbildungen beispielhaft beschrieben. Es sei jedoch betont, dafi die Erfin- 
dung mcht auf diese Beispiele beschrSnkt ist, sondem sich durch Analogieschlufi unter 
Verwendung obiger Definitionen fiir die Rmktions- und Strukturkomponenten auf beUe- 
bige topologieerhaltende AbbUdungen anwenden lafit, auch wenn diese hier nicht explizit 
aufpfiUirt smd. Insbesondere sei betont, dafi die Erfindimg unabhdngigist (i) von der kon- 
l^eten Wahl freier Parametem topologieerhaltender AbbUdungen, (ii) von der konkreten 
WaM emer Kooperativitatsfunktion etwa im Sinne der Punktion ^ gemafi Abschnitt 1 1 
(m) von der konkreten WaM bestimmter Annealing-Schemata, z. B. fiir Lemparameter' 
etwa m Smne von e in Abschnitt 1.1, (iv) von der Art der Datenprasentation, d. h. ob 
J^.TT^ .f" Anordnungsdatenobjekte sequentiell oder paraUel im Sinne von 
batch -Algonthmen prasentiert werden, bei denen in einzelnen Ttainingsschritten auch 
mehr als em Datenobjekt verarbeitet werden kann. 

2.3.1 XOM fur die selbstorganisierende Karte 

ffierbei konnen gemafi XOM-Definition die Bingabedaten die Datenobjekte des Anord- 
nungraumes bestimmen, wohingegen Strukturhypothesen die Eigenschaften des Erkun- 
dungsraumes bestimmen konnen. Fiir die selbstorganisierenden Kaxten gelten im Zusam- 
meniang nut XOM folgende Festsetzungen: Der Merkmalsraum der selbstorganisierenden 
Kaxte gemafi Ab^tt 1.1 entspricht dem Erkundungsraum, der ModeUcortex der selbst- 
organisierenden Kaxte gemafi 1.1 entspricht dem Anordnungsraum. 

Im ModeUcortex gemafi Abschnitt 1.2 werden also Bingabedaten prasentiert, d h der 
Modellcort^ wird durch Bingabedaten ganz oder teUweise bestimmt. Handelt es sich bei- 
spielsweise bei den Bingabedaten Z urn Vektoren in einem Jfe-dimensionalen metrischen 
Raima also^ = {(z") (z" elR^u e {l,...,p}, k,p € IN} so konnen die Positionsvekto- 
ren der selbstorganisierenden Kaxte mit diesen gleichgesetzt werden. Hierdurch ergibt sich 
1. a. erne durch Bingabedaten bestimmte Ibpologie des Anordnungsraumes, die im Gegen- 
satz zum Stand der Technik bei der Verwendung selbstorganisierender Karten nicht einem 
distoreten periodischen Gitter entspricht. Das TVaining der selbstorganisierenden Karte er- 
iolgt dann nut Datenobjekten eines beUebig gewahlten Erkundungsraumes. Dieser kann 
emer Strukturhypothese entsprechen, jedoch auch direkt iiber Bingabedaten definiert sein 
Mit den Konventionen aus Abschnitt 1.2 kann also beispielsweise folgende Vereinbarune 
getroffai werden: r„ = z". Als Erkundungsraum wird nun eine beUebige Menge von Dat^ 
nobjekten festgelegt, beispielsweise Datenvektoren auf einer beliebigen Mannigfaltigkeit 
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un ]R , die z. B. einer Gleichverteilung, einer GaufiverteUung oder sonstwie in der Wahr- 
S(±emlicl^eitstheorie beschriebenen VerteUung geniigen. Denkbar ist grundsatzUch auch 
jede beliebige andere Festlegung des Erkundungsraumes, sei sie nun von den Eingabedaten 
abhdngig oder im Sinne oner Strukturhypothese nicht unmittelbar durch Eingabedaten 
eindeutig berechenbar. 

Neben der oben angefuhrten Entflechtung der strukturellen und funktioneUen De- 
fimtaonen der an topologieerhaJtenden Abbildungen beteiHgten Datenraume besteht ein 
besonderer Aspekt der Erfindung zusatzUch in der VeraQgemeinerung des oben definierten 
Begriffis der Anordnungsobjekte iiber die dem Stand der Technik entsprechende Interpreta. 
tion als Vektoren in metrischen Raumen hinaus auf beUebige Datenobjekte, insbesondere 
auf Distanzobjekte zwischen Datenobjekten. Im Pall der selbstorganisierenden Karte be- 
deutet dies, da£ die Topologie des Modellcortex durch beliebige Dissimilaritaten definiert 
sein kann, die keiner Metrik im mathematischen Sinne geniigen miissen. Die Anordnungs- 
objekte (Neuronen) mflssen also nicht Vektoren im IR" reprasentieren. 

2.3.2 XOM fiir Generative Topographic Mapping 

Zur Prazisierung der Begriffe Anordnungsraum und Erkundungsraum seien bei Gene- 
rative Topographic Mapping (GTM) folgende Festsetzungen getroffen, die sich auf die 
Pubhkation [3] beziehen: Der Raum, der in [3] als "latent space" bezeichnet wird, ent- 
spricht dem Anordnungsraum, seine Datenobjekte werden in dieser Publikation als "latent 
vanables x" bezeichnet. Die Datenobjekte des Erkundungsraumes werden in [3] mit der 
Vanable t bezeichnet. 

2.3.3 XOM fOr topographische Vektorquantisierer 

Zur Praaisierung der Begriffe Anordnungsraum und Erkundungsraum seien bei den in der 
Literatur beschriebenen topographischen Vektorquantisierem (z. B. Topographic Vector 
7^J!^S^.r^^'' Topographic Vector Quantizer (STVQ), Soft Self-Organizing Map 
(SSOM), Kernel-Based Soft Topographic Mapping (STMK), Soft Tbpographic Mapping 
of Proximity Data (STMP)) [13, 14]) folgende Festsetzungen getroffen. die sich auf die 
Pubhkation [14] beziehen: Die Datenobjekte, die in [14] als "nodes" mit den Variablenbe- 
zeichnungen r bzw. s bezeichnet werden, entsprechen Datenobjekten des Anordnungsrau- 
mes. Die Datenobjekte, die in [14] als "data vectors x(<)» bezeichnet werden, entsprechen 
Datenobjekten des Erkundungsraumes. 

Durch Analogieschlufi ist es mSgUch, auch in anderen, hier nicht beschriebenen Be- 
redmungsvorschriften fiir topologieerhaltende Abbildungen, Erkundungsraum und An- 
ordnimgsraimi voneinander abzugrenzen. 
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3 Detaillierte Beschreibung der Erfindung, Teil II 

In der nachfolgenden AufeteUung werden zusatzUche durch das Patent zu schiitzende 
Verfahren, Vorrichtungen und Anwendungen besdirieben: 

1. (a) XOM-Definition: Verfahren und Vorrichtiing zur Datenverarbeitung durch 
topologieerhaltende AbbUdungen, wobei im Gegensatz zum Stand der Tech- 
nik sowohl der Anordnungsraum als auch der Erkundungsraum beliebig durch 
Eingabedaten oder Strvkturhypothesen bestunmt werden konnen. Insbesondere 
konnen im Gegensatz zum Stand der Technik Eingabedaten Datenobjekte des 
Anordnungraumes bestimmen, umgekehrt Strukturhypothesen Datenobjekte des 
Erkundungsraumes bestimmen. 

Die Aussage, dafi Eingabedaten Datenobjekte des Anordnungsraumes "bestim- 
men", bedeutet hierbei, dafi es ein Beredmungsverfahren gibt, mit dem Date- 
nobjekte des Anordnungsraumes aus Eingabedaten ohne RUckgnff auf Struk- 
turhypothesen beredmet werden koimen. 

Die Aussage, dafi Strukturhypothesen Datenobjekte des Erkundungsraumes 
"bestimmen", bedeutet, dafi es kein Beredmungsverfahren gibt, mit dem diese 
Datenobjekte ohne Ruckgnff auf Strvkturhypotheaen aus Eingabedaten beredi- 
net werden kdimen. 

Im Gegensatz zum Stand der Tedmik unterliegt die Wahl des Erkundungsrau- 
mes keinen Besdu-ankunen insofem, als es es sich bei seinen Datenobjekten 
neben Eingabedaten audi lun Strukturhypothesen handeln kann. 
Hierbei mufi es sidi ausdriiddidi nidit urn Daten haadeln, die auf einer ein- 
zelnen Mannigfialtigkdt im ffi," gleidiverteUt sind, sondem in beUebigen Dar 
tenraumen beliebig verteilt sein konnen. Beispiele fur interessante Verteilimgs- 
muster sind unten in 5 aufgefuhrt. Diese Vertdlungsmuster konnen audi im 
Laufe eines l^Mningsvorgangs oder im Rahmen einer Folge von Trainings- 
vorgangen der topologieerhaltenden Abbildung dynamisdi vo-anderlidi gewSMt 
werden, z. B. unter Beriidcsiditigung der aktueU oder in einem friiheren Stadi- 
um durdi die topologieerhaltende Abbildung geUeferten Ausgabedaten bzw. Er- 
gebnisse, z. B. Codebudiobjekte oder die durdi sie induzierte Ibpologie, wo- 
durdi insbesondere dynamisdie Strukturhypothesen generiert werden konnen. 
Es sei audi betont, dafi die gewahlten Verteilungen im Erkundungsraum sta- 
tisdi Oder dynamisdi von den Eingabedaten beeinfluflt werden konnen. 
Umgekehrt unterliegt audi im Gegensatz zum Stand der Tedmik die Wahl des 
Anordnungsraumes keinen Besdirankungen, als es sidi bei seinen Datenobjek- 
ten neben Strukturhypothesen audi um Eingabedaten handebi kann! 
Im Gegensatz zum Stand der Tedinik kann also den Eingabedaten der An- 
ordnungsraum und den Strukturhypothesen der Erkundungsraum zugeordnet 
werden. 
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(b) 



r T^LSTnttf ^'f^^ Anordnungsobjekte fiber deLlS 
der ife<dmik enteprechende-Interpretation als Vektoren in metrischen Raumen 

S:rob]^kt'et'^^ ^^^^^^'^^'^^ auf Disl^^jSt^^^S 

b^'^D^a^ ^ Datenobjekte, die AhnUchkeitsbezie- 

nungen bzw. D^tanzen zwischen Datenobjekten gemafi einem beliebiffen dT 

^cS ol^^Sl^Tf T"" ^i^^^tateneingeschlossen. Einige 
Distaazmafie auf der Basis von Dissimilaxitaten sind z. B. in [191 auf- 
gefo^. Metrik wd luerbeiinmathematischemSinned^^^^ 
Der Ernsatz von XOM zur Datenverarbeitung kann andx insbesondere erfol 
gen zum Training mehr aJs eine ^aWenhangendTDrenvSeSmt 

un Erkundunpraum benutzt wird; wenn zum 'ftaimng kelne S^e D J 
tenverteilung un Erkundungsraum benutzt wird; wenn die D^te^X od^ 
S^^r ^ Anordnungsraum nicht ein'er Metrik i^ t^tmSL^en 

driT^^VT?" ™" "^^S DatenverteilungrrErW 
dungsranm mcht konvex sind; wenn die Datenobjekte oder TeiW^ d^Z 
^ i^ordnnn^aum od^im Erkundungsraum nlcht der eukllSTerGeom ° 
S w'X'dt ^^."^^ b-liebige Dissimilaritat^X^JSL'rt • 
^t rSTpn^. ^"^^ beUebigen Datenobjekten verwe^ 

det werden be^ielsweise geodatische Distanzen oder einer Ranemetrik^Tn 
die topologieerhaltende Abbildung nicht der sequenUTn F^S^^rner 

«ann vgi. auch Punkt Im; wenn fur die VisuaJisierung der Ergebnisse nicht 

Tnl^-f^^ A verwendet werden, um die Eigenschaften, z. B Se S 

^til^^T^'^'^TrT ^d/^'*^ Strukturhypothest, ^ 

die Eigenschaften des Erkundungsraumes festzulegen. Besondei^ gesSt^ 
die Verwendung von Anordnungsraumen mit frltaler lokaleTodrS^JS 
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Dimension. 



^""^ Xo'S'r*''*^ von irreguiarer Struktur des Anordnungsraumes mit 

(d) Bestimmung des Erkundungsraumes durch Strukturhypothesen- Eir, 
weiterer wesentUdier Aspekt sind Verfahren „t.H \r^rZ ^ 

MMierte jUmUchkeitsbeaehimgm bzw. DiBsimlaiiUtoi einEeBchlossen 
tak wd hierbei m mathematiachem Slme deSniert siehelTSl ^'JZ 

ninon der Rai^metnk zwBchen dem Gewimiemeuron md den anderm cJL 

Datenobiekten al<?o ni=t«w,»«K- i - ' ^ 7 aulgefuhrt. Distanzen zwischen 
Recbe.^.teJ^^S^C.^™r 

e»«^ • i_i weraen, ggf. auch dynamisch. Eine solche Atit^pq 

denen „icbt aUe 'kL. ^i^^^ l^ZSS S"^! 
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nung einbezogen werden sollen, (iii) bei Moleladardynamiksiinulationen, bei 
denen die durch die kovalente Struktiir des Molekiils vorgegebenen Zwangs- 
bedingungen oder die zwischen einzebien Atomen wirkenden Krafte mxr eine 
echte Teilmenge von paaxweisen Distanzen zwischen den Atomen defibaiert ist 
bzw. fiir das Training der topologieerhaltenden Abbildung genutzt werden soil, 
(iv) bei Anwendungen in der Robotik, z. B. im Rahmen der inversen Kinemar 
tik, bei denen z. B. durch Zwangsbedingungen nur eine echte Teilmenge der 
paarweisen Distanzen zwischen den Robotergelenken definiert ist bzw. fur das 
Tr ainin g der topologieerhaltenden Abbildung genutzt werden soil. 
Besonders tnteressant ist der Fall sparlich codierter Distanzmatrizen. 

(f) Nichtmetrische Anordnimgsraume und Eingabedateuraume: Beson- 
ders sei noch einmal betont, dafi im Gegensatz zum Stand der Technik Verfah- 
ren und Vorrichtungen in die Brfindimg einbezogen sind, bei denen zur Fest- 
legung der Topologie des Anordnungsraumes im mathematischen Sinne nicht- 
metrische Distanzmafie verwendet werden, fiir die z. B. fur eine echte oder 
unechte Teilmenge der paarweisen Distanzen die Symmetrierelation und/oder 
die Dreiecksungleichung nicht erfallt sind/ist. Die Anordnungsobjekte konnen 
also im Gegensatz zum Stand der Technik einen nichtmetrischen Raum definie- 
ren, d. h. nicht einem metrischen Raum gemSfi der Defimtion in [5] entsprechen. 
Besonders geschutzt ist dieser Teilaspekt der Erfindung, wenn zur Festlegung 
der Topologie des Anordnun^raumes nicht nur Striikturhypothesen, sondem 
auch Eingabedaten verwendet werden, 

(g) Nichtetddidische XOM Der Anordnungsraum, Erkundungsraum oder Er- 
gebnisraum oder beliebige Kombinationen dieser Raume konnen einer nichteu- 
klidisdien, z. B. hyperbolischen Geometrie geniigen. 

(h) Lokale Nachbarschaften, Beschleunigung durch schnelle Suche nach- 
ster Nachbarn, sparliche Distanzmatrizen: Fur das Training der topolo- 
gieerhaltenden Abbildung konnen insbesondere nur oder nur zum Teil Date- 
nobjekte aus lokalen Nachbarschaften der Datenobjekte im Anordnungsraum 
und/oder Erkundungsraum und/oder Ergebnisraum benutzt werden, d. h. hier- 
durch erzeugte spaxlich kodierte Distanzmatrizen verwendet werden. Hierzu 
konnen insbesondere Beschleunigungsstrategien zur Definition der lokalen Nach- 
barschaften, z. B. zur Suche nach den k nachsten Nachbarn, eingesetzt werden, 
wie sie dem Stand der Technik (vgl. z. B. [30], [29] und dort zitierte Literatur 
sowie [9]) Oder dieser Patentschrift entsprechen, insbesondere im Hinblick auf 
imten folgende Punkte 5 und 12. 

(i) Fraktale: Bin besonderer Aspekt der Erfindung ist, dafl bei Verfahren und 
Vorrichtungen gemafi obiger XOM-Definition als Anordnungsraum Datenver- 
teilungen verwendet werden konnen, die nach in der Literatur (z. B. [27] imd 
dort zitierte Literatur, [16]) oder in dieser Patentschrift beschriebenen Dimen- 
sionsbestimmungsverfahren lokal oder global eine fraktale Dimension besitzen. 
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LokaJ bedeutet hier und im folgenden, dafi die Dimensionsbestimimiiig fur ein- 
zelne Datenobjekte durchgefiihrt wird, wohingegen global, dafi die Dimensions- 
bestimmung fiir mehr als ein Datenobjekt diirchgefulirt wird, z. B. fiir einen 
gesamten Datensatz. Umgekehrt konnen Datenverteilungen mit fraktaler Di- 
mension auch den Erkundungsraum definieren. Besonders geschiitzt sind Ver- 
fahren und Vorrichtungen, bei denen der Anordnungsranm Datenverteilungen 
mit fraktaler Dimension enthait, wobei diese Datenverteilungen Eingabedaten 
sind, ebenso Verfahren und Vorrichtimgen, bei denen der Einbettungsraum Dar 
tenverteilungen mit fraktaler Dimension enthait, wobei diese Datenverteilungen 
Strukturhypotliesen sind. Besonders geschiitzt ist auch die Kombination aus 
bdden Mdglidikeiten. 

(j) Nichtorientierbare Piachen, Moebiusband und Kleinsche Flasche: So- 

wohl der Anordnnn^raum als auch der Erkundungsraum konnen Datenvertei- 
lungen enthalten, bei denen die durch die Datenobjekte im jeweiligen Raum 
erzeugte Topologie eine nichtorientierbare Plache im Sinne der Differential- 
geometrie beschreibt, z. B. ein Mobiusband oder eine Kleinsche Flasche. Be- 
sonders geschiitzt sind Verfahren und Vorrichtungen, bei denen der Anord- 
nungsraum derartige Datenverteilungen enthait, wobei diese Datenverteilungen 
Eingabedaten sind, ebenso Verfahren und Vorrichtimgen, bei denen der Erkun- 
dungsraum derartige Datenverteilungen enthait, wobei diese Datenverteilungen 
Strukturhypothesen sind. Besonders geschiitzt sind aueh die Kombinationen 
aus beiden Moglichkeiten. 

(k) Stochastische XOM: Sowohl der Anordnimgsraum als auch der Erkxmdungs- 
raum konnen Datenverteilungen enthalten, die Ergebnis eines Zufallsexperi- 
nientes sind. Besonders geschiitzt sind Verfahren und Vorrichtungen, bei denen 
die durch die Datenobjekte im Anordnimgsraum induzierte Topologie durch ein 
Zufallsexperiment beeinflufit wird, ebenso Verfahren und Vorrichtungen, bei 
denen Datenobjekte des Erkimdungsraumes im Sinne einer Strukturhypothe- 
se durch ein Zufallsexperiment bestimmt werden, sowie Kombinationen beider 
Moglichkeiten. 

(1) Hinzufiigen oder Weglassen von Datenobjekten im Anordnungsraum: 
Auf der Basis der XOM-Definition konnen Verfahren und Vorrichtungen kon- 
struiert werden, bei denen vor oder wahrend eines Trainingsvorganges oder 
vor Oder wahrend einer Folge von lirainingsvorgangen der topologieerhalten- 
den Abbildung zum Anordnungsraum eines oder mehrere neue Datenobjekte, 
insbesondere auch Distanzobjekte, hmzugefugt werden und die topologieerhal- 
tende Abbildung partiell oder vollstandig nachtrainiert wird. Insbesondere laflt 
sich dieses Vorgehen zur Interpolation, Extrapolation oder Approximation neu- 
er Datenobjekte durch die topologieerhaltende Abbildimg verwenden. Umge- 
kehrt konnen in analoger Weise auch Datenobjekte, insbesondere auch Distan- 
zobjekte, aus dem Anordnungsraum entfemt oder beliebig verandert werden, 
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bevor die topologieerlialtende AbbOdung paxtiell oder vollstandig naditraimert 
wird. Insbesondere konnen Mafie zur lokalen oder globalen AbbUdungsqualitat, 
z. B. im Sinne von 2 verwendet werden, um Datenobjekte des Anordnungsrau- 
mes zielgerichtet zu erzeugen, zu entfernen oder zu verandem. 

(m) Codebuchobjektspezifische Variation der Berechnimgsvorschrift: Es 

sei betont, daB auf der Basis der XOM-Definition insbesondere auch Verfahren 
und Vorrichtungen entwickelt werden konnen, bei denen beim Training der to- 
pologieerhaJtenden Abbildung nicht alle zu den Datenobjekten im Anordnungs- 
raum gehorenden Codebuchobjekte durch die gleiche Beredmungsvorschrift 
trainiert werden. Viehnehr ist es haufig moglich und/oder geboten, fur nnter- 
schiedliche Codebuchobjekte untersciiiedliche Berechnungsvorschriften anzu- 
wenden oder Parameter der gleichen Beredmungsvorschrift fur unterschiedli- 
che Codebuchobjekte zu variieren. Beides kann auch dynamisch innerhalb eines 
einzelnen Trainingsvorganges oder in einer Polge mehrerer lirainingsvorgaiige 
erfolgen. Insbesondere sind auch Verfahren und Vorrichtungen moglich, bei 
denen nicht jedem Datenobjekt des Anordnungsraumes genau ein Codebuch- 
objekt zugeordnet ist. Viehnehr konnen unterschiedlichen Datenobjekten des 
Anordnimgsratmies unterschiedliche Anzahlen und Typen von Codebuchob- 
jekten zugeordnet werden, wobei diese Anzahlen imd Typen auch dynamisch 
veranderlich gewahlt werden koimen, z. B. im Hinblick auf das spezifische Da- 
tenverarbeitungsproblem, auf den jeweiligen Trainingszustand der topologieer- 
haltenden Abbildung, auf die aktuell oder friiher erreidxte Abbildungsqualitat 
oder auf beliebige, z. B. durch das Datenanalyseproblem induzierte Zusatzbe- 
dingimgen. Es kann auch Datenobjekte des Anordnimgsraumes geben, denen 
standig oder vorubergehend kein Codebudiobjekt zugeordnet wird. Ein wich- 
tiges Beispiel fur die dynamische, codebuchobjektspezifische Anpassung der 
Berechnungsvorschrift ist die Anpassung der Kooperativitatsfunktion selbst- 
organisierender Karten im Hinblick auf Mafie der lokalen Topologieerhaltung, 
etwa im Sinne von Verfahren wie [7] 

(n) Datenobjektspezifische Variation der Eigenschaften, z. B, Berech- 
nungsvorschriffc fur Datenobjekte des Erkmidirngs- und/oder Anord- 
nungsraumes: Die in Im beschriebene datenobjektspezifische Variabilitat gilt 
sinngemafi auch fur unterschiedliche Objekte des Erkundungsraumes und/oder 
des Anordnungsraumes, z. B. kann die Berechnungsvorschrift der topologieer- 
haltenden Abbildimg datenobjektspezifisch variieren, Sie l^-anTi insbesondere 
auch dynamisch veranderlich gewahlt werden, z. B, im Hinblidc auf das spezi- 
fische Datenverarbeitungsproblem, auf den jeweiligen Trainingszustand der to- 
pologieerhaltenden Abbildung, auf die aktuell oder friiher erreichte Abbildungs- 
qualitat Oder auf beliebige, z. B. durch das Datenanalyseproblem induzierte 
Zusatzbedingungen. Auch konnen Datenobjekte des Erkundungs-, Ergebnis- 
imd/oder Anordnungsraumes, z. B. im Hinblick auf die soeben genannten Kri- 
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terien, dynamisch veranderUdi sein, z. B. kdnnen neue Datenobjekte dynamisch 
erzeugt, bestehende Datenobjekte dynamisch entfemt oder beUebig verSndert 
werden. ° 

(o) Uberwachte XOM: Das IVaining der topologieerhaltenden AbbUdung kann 
m Abh^gigkeit von Datenobjekten oder Eigenschaften von Datenobjekten er- 
folgen, die nut den Datenobjekten des Anordnungsraumes assoziiert sind. Inter- 
essant ist der EaU, dafi Datenobjekten des Anordnungsraumes weitere Daten- 
objekte a^oziiert sind, die im Anordnungsraum nicht auftreten bzw. Datenob- 
jekte des Anordnungsraumes Zusatzeigenschaften besitzen, die fur die Bestim- 
mung des Anordnungsraumes standig oder voriibergehend nicht berucksichtiet 
w^en. Ein b^onders wichtiger FaU Hegt vor, wenn diese zusatzUchen Date- 
nobjekte Oder Eigenschaften von Datenobjekten im Sinne von Punktionswer- 
ten mteri^etiert werden, die Datenobjekten des Anordnungsraumes zugeordnet 
warden Hier wiederum ist besonders der FaU wichtig, bei dem diese zusatz- 
hchen Datenobjekte oder Eigenschaften von Datenobjekten dazu verwendet 
werden, den Erkundungsraum, den Anordnungsraum, den Ergebnisraum oder 
die da topologieerhaltenden AbbUdung zugrundeUegende Datenverarbeitungs- 
vorscMt Oder deren Parameter in zidgerichteter Weise, insbesondere datL 
objektspezifisch, zu verandem. ffierdurch lessen sich unterschiedUchste, auf 
XOM basierende Verfaliren und Vorrichtungen zum iiberwachten Lemen kon- 
struieren, insbesondere z. B. zton InterpoUeren, Extrapolieren, Approximieren 
Oder zur sonstwie gearteten Verarbeitung von Punktionen konstruieren. Es sei 
betont da£ es sidi bei den Datenobjekten des Anordnungsraumes sowie den 
zusaozhchen nut diesen assoziierten Datenobjekten bzw. Objekteigenschaften 
sowohl urn Emgabedaten als auch urn Strukturhypothesen haadeln kajm. 
(p) XOM unter Zusatzbedingungen: Ein besonders wichtige XOM-Variante 
besteht dann, dafi das IVaining der topologieerhaltenden Abbildung durch 
Zusatzbedmgungen beeinflufit wird, die beUebige Eigenschaften des Erkun- 
dungsraumes des Anordnungsraumes oder des Ergebnisraumes beeinflussen 
z. B. im Hmbhck auf das spezifische Datenverarbeitungsproblem, auf den ie- 
weiligen Tramingszustajid der topologieerhaltenden AbbUdung, auf die aktuell 
Oder fruher eneichte AbbUdungsquaUtSt oder auf beUebige, z. B. durch das 
Datenaa^yseproblem induzierte Zusatzbedmgungen. So ist es beispielsweise 
moglich, die Wa^derung einer echten oder unechten TeUmenge der Codebuch- 
objekte im Ergebnisraum statisch oder dynamisch einzuschranken oder sonst- 
wie zu beeinflussen. 

(q) Dynamisch veranderlicher Erkundungsraum, vvrachsende XOM-Ab- 
bildungen: Besonders hervorzuheben sind XOM-Realisierungen, bei denen der 
ErkundungCTaum bzw. seine Datenobjekte im Verlaufe eines TVainingsvorganfis 
aIwiT TtainingsvorgSngen der topologieerhaltJidii 

Abbildung zielgenchtet oder nicht zielgerichtet beeinflufit werden, d. h dyna. 
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misch veranderlich sind, z. B. im Hinblick auf Kriterien der aktuell oder friiher 
erreichten lokalen oder globalen Qualitat der topologieerhaltenden Abbildung, 
z. B. im Sinne von 2. Besonders wichtig ist der Fall von XOM-Abbildungen 
mit wadisenden, schnimpfenden, sich teilenden oder sonstwie global oder lokal 
veranderlichen Erkimdungsraumen, bei denen sukzessiv Strukturhypothesen, 
z. B. uber Eingabedaten verbessert werden soUen. 

Umskalierung der Distanzen im Anordnungsraum, Sparseness Amie- 
alingz Besonders interessante XOM-Verfahren mid -Vorrichtungen verandern 
wahrend des TVadningsvorgangs oder im Laufe einer Folge wiederholter Trai- 
ningsvorgange der topologieerhaltenden Abbildung die Topologie des Anord- 
nungsraumes, z. B. durch eine mathematisch formulierbare Berechnimgsvor- 
schriffc. Diese kann beispielsweise von der aJctuell oder in einem friiheren Stadi- 
um erreichten Abbildungsqualitat oder von der aktuell erreichten Anzahl von 
Trainingsschritten oder Trainingsvorgangen abhangen. Wenn die Topologie des 
Anordnungsraimies durch eine echte oder unechte Teihnenge der paarweisen 
Distanzen zwischen den Datenobjekten des Anordnungsraumes reprasentiert 
wird, so kann hierbei eine globale, d. h. alle verwendeten Distanzen betreffen- 
de, Oder auch eine lokale, d. h. individuell angepafite Umskalierung einzelner 
Distanzen vorgenommen werden. Durch diese Umskalierung kann beispielswei- 
se erreicht werden, daB der relative Anteil grofier Distanzen an der Gesamtzahl 
der verwendeten Distanzen im Verlauf eines oder mehrerer Trainingsvorgange 
der topologieerhaltenden Abbildimg zunimmt. Beeinflussen diese grofien Di- 
stanzen das Training der topologieerhaltenden Abbildung nur wenig, so konnen 
diese fur das weitere Training vemachlassigt werden. Dies entspricht einer zu- 
nehmenden funktionellen "Ausdiinnung*' der Distanzmatrix, d. h. die Anzahl 
der beim Training der topologieerhaltenden Abbildung zu beriicksichtigenden 
Distanzen nimmt ab, ffierdurch ergibt sich u. a. eine Reduktion des Rechen- 
aufwandes. Dieses Vorgehen sei als "Sparlichkeitsabkiihlung" oder "Sparseness 
Aiinealmg" bezeichnet. Eines beliebig vieler denkbarer Schemata ist zum Bei- 
spiel folgendes: Seien dij{t) die Distanzen zwischen Datenobjekten i und j des 
Anordnungsraumes im Tirainmgsstadium t. Seien dij die ursprunglichen Distan- 
zen. Durch Umskalierung gemaS 



mit Of > 0 kann beispielsweise erreicht werden, dafi dij{t) > ckj fiir dij > a(t) 
gilt, ffierbei kann a{t) als eine mit t monoton abnehmende Punktion gewahlt 
werden (z. B. im Sinne eines Abkiihlungsschemas wie etwa nach Gleichung 
(10)). Durch Variation von a kann die Starke der nichtlinearen Verzerrung 
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beeinflufit werden. Fur die Umskalienmgsvorschrift 



ergibt sich fur a » 1 ein Verhalten, bei dem die Distanzen fiir ckj <.a{t) nahezu 
unverandert bleiben, hingegen fur dij > a(t) jedoch deutlich hochsloiiert wer- 
den. Unter Umstanden kann es auch sinnvoU sein, nur Distanzen dij in einem 
bestinimten Grofienintervall [a, 6] niit a, b € lEl, a, b > 0 fiir das Ttaining der 
topologieerhaltenden Abbildung zu berucksichtigen. ffierzu koimte man z. B. 



Es sei betont, dafi die Umskalierung der Distanzen nicht auf diese oder ahnli- 
che Rechenvorschriften beschrankt ist, sondern problemangepafit im Hinblick 
auf die jeweilige Datenverarbeitungssituation beliebig erfolgen kann. Auch ist 
es nicht erforderlich, bei den vom Trainingsstadium der topologieerhaltenden 
Abbildung abhangigen Umskalierungen diese in jedem Trainingsschritt jeweils 
neu zu berechnen. Viehnehr kann es geniigen, dies erst wieder nach einer Folge 
mdirerer iftainrngsschrittezu-ttm^-^adTif^^ 
Rechenaufwandes ergeben kann. 

(s) Iteration: Verfahren und Vorrichtungen gemafi XOM-Definition konnen auch 
iterativ angewandt werden, indem Datenobjekte des Ergebnisraums einer ge- 
mafi XOM trainierten topologieerhaltenden Abbildxmg ganz oder teilweise da- 
zu benutzt werden, den Anordnungsraum einer weiteren topologieerhaltenden 
Abbildung oder eines neuen Trainingsschritts oder Trainingsvorgangs dersel- 
ben topologieerhaltenden Abbildung zu definieren oder zumindest zu beein- 
flussen. Dies sei an einem Beispiel erlautert: Wird beispielsweise durch XOM 
eine nichtlineare Einbettung einer Datenverteilung im IR*^, welche als Anord- 
nungsraum dient, in eine Datenverteilung im IR**, welche als Erkundungsraum 
dient, vorgenommen, wobei fc,n G IN, so erhalt man im einfachsten Fall als 
Ergebnisraum eine Menge von Codebuchvektoren im R*. Diese konnen nun 
direkt oder durch eine geeignete Berechnungsvorschrift dazu benutzt werden, 
den Anordnungsraum einer neuen XOM-AbbHdung festzulegen, die beispiels^ 
weise die durch diese Codebuchvektoren induzierte Topologie auf eine Daten- 
verteilung im IR"*, m € IN abbildet, welche nunmehr als Erkundungsraum einer 
topologieerhaltenden Abbildung verwendet wird. Aus dem Ergebnisraum der 
ersten XOM-Anwendung wird also der Anordnungsraum einer weiteren XOM- 
Anwendung erzeugt. Dieses Verfahren lafit sich beliebig iterieren. Ein wichtiger 
SpezialfaU besteht darin, dafi der Ergebnisraum bzw. Erkundungsraum einer- 
seits und der Anordnungsraum andererseits wechselseitig ihre Rollen tauschen. 



setzen: 




dij < a 
rfij €[a,6] 
dij > b. 
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Dies kann ebenfalls iterativ diarchgefulart werden. Selbstverstandlich unterliegt 
die Wahl der zugrundenliegenden Datenobjekte, Raume und DistaazmaBe kei- 
nen Beschrankimgen. 

(t) Selbstorganisation, Selbstregeneration, Selbstreproduktion, Morpho- 
genese, verteilte Wissensreprasentation: Durdi XOM konnen leistungsfa- 
hige Verfahren und Vorrichtungen konstniiert werden, die charakteristische Ei- 
genschaften lebender Systeme besitzen, insbesondere Selbstregeneration, Selbst- 
reproduktion und Selbststabilisierung, Lokalitat der Informationsverarbeitung 
bzw. verteilte Wissensreprasentation. Ein Beispiel, wie solche Systeme kon- 
struiert werden konnen sei im folgenden erlautert: Ausgangspunkt sind Daten- 
objekte, die im folgenden als "Zellen" bezeichnet werden: diese reprasentieren 
Telle eines Gesamtsysteros, das im folgenden als "Organismus" bezeichnet wird. 
Eine Zelle besitzt folgende Datenobjekte, Eigensdiafben, Verfahren bzw. Vor- 
richtungen, im folgenden 'TElemente" genannt: 

• Information, die erforderlich ist, urn den Anordnungsraum einer topolo- 
gieerhaltenden Abbildung teilweise oder vollstandig zu konstruieren. Die- 
se entspricht dem "Bauplan" des Gesamtorganismus. Dieser mnfi nicht 
vollstandig in jeder Zelle vorhanden sein. 

• Verfahren und Vorrichtung, mit der die Zelle bestimmen kann, welches oder 
welche Datenobjekte des Anordnimgsraumes, Erkundungsraumes mid /oder 
Ergebnisraimies einer topologieerhaltenden Abbildung in welcher Weise ihr 
zugeordnet sind: die hierdurch erhaltene Information wird im folgenden 
'Position' im jeweiligen Raum genannt. 

• Verfahren und Vorrichtung, mit der die Zelle ihre Positionen im Anord- 
nungsraum, Erkundungsraima und/oder Ergebnisraum oder auch andere 
Information anderen Zellen mitteilen kann bzw. die diesbeziiglich durch 
andere Zellen mitgeteilte Information verwerten kann 

• Verfahren und Vorrichtung, mit der die Zelle unter Verwendung einer 
XOM- Abbildung eine neue Position im Ergebnisraum emaitteln WanTi 

• Verfahren und Vorrichtung, mit der die Zelle ihre Position im Ergebnis- 
raiun verandern kann, z. B. im Hinblick auf die unter Verwendung einer 
XOM-Abbildimg ermittelte neue Position im Ergebnisraum 

• Verfahren und Vorrichtung, mit der die Zelle die Konsistenz (siehe unten) 
ihrer Positionen in den xmterschiedlichen Raumen uberpriifen imd ggf. kor- 
rigieren kann 

Optional konnen auch folgende Blemente vorliegen: 

• Verfahren und Vorrichtung zur Selbstkopie der Zelle 

• Verfahren und Vorrichtung zur Selbstzerstorung der Zelle 

• Verfahren und Vorrichtung zur Veranderung der Datenobjekte oder Eigen- 
schaften der Zelle 
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Es sei betont, dafi eine Zelle nicht alle aufgefuhrten Elemente besitzen miifi. 
Audi sei betont, dafi die aufgefiihrten Elemente nicht unbedingt "lokal", d. h. in 
der einzebien Zelle, reprasentiert sein miissen. Vielmehr ist es denkbar, dafi die 
Zelle auch auf globale, d. h. mehr als eine Zelle betreffende Reprasentationen 
obiger Elemente zuriickgreifen kann. Dies kann insbesondere fur die Konstruk- 
tion tedmischer Systeme durdi XOM Vorteile bieten. 

Das "Leben", d. h. der Punktionszustand des Organismns wird nxm wesent- 
lidi dmrch XOM bestimmt. Als typisdies Beispiel sei hierzu eine sequentielle 
Vorgehensweise skizziert, bei der alle ZeUen an alien Sdiritten teilnehmen. Die- 
se Bedingungen miissen jedodi nidit erfiillt sein, d. h, es koimen in analoger 
Weise Vorgehensweisen entwidcelt werden, bei denen nicht alle Zellen an alien 
Sdiritten teilnehmen und/oder eine parallele, d. h. gleichzeitig mehrere Date- 
nobjekte betreffende Datenverarbeitung stattfindet. Die folgende Darstellung 
ist durch das Vorgehen bei selbstorganisierenden Karten motiviert, lafit sich 
jedoch einfach auf andere topologieerhaltende Abbildungen ubertragen. 
Zunachst wird ein Datenobjekt des Erkundungsraumes einer topologieerhalten- 
den Abbildung ausgewahlt, im folgenden "Reiz" genannt. Jede Zelle bestimmt 
nun ihre Position im Erkundungsraum relativ zu diesem Reiz. Beispielsweise 
ist es denkbar, dafi die Zelle ihre Distanz (bzgl. eines beliebigen Distanzmafies) 
im Erkundungsraum zu diesem Reiz ermittelt. Die Zellen teilen sich gegenseitig 
Information tiber ihre relative Position zum Reiz mit. Die Zellen vergleichen 
mm diese Informationen und ermitteln eine Zelle, deren Position im Erkun- 
dungsraum am besten mit dem Reiz iibereinstimmt, die sog. "Gewinnerzelle" . 
Diese Gewinnerzelle teilt nun alien Zellen ihre Position im Anordnungsraum 
mit. Die Zellen vergleichen nun diese Information mit ihrem Wissen fiber den 
Anordnungsraum, Entscheidend ist, dafi dieses Wissen lokal in den einzelnen 
Zellen verfiigbar ist (verteilte Wissensreprasentation). Dieses Wissen entspricht 
einem "Bauplan" des Organismus, der partiell oder voUstandig in jeder Zelle 
vorhanden ist. Hierdurch ist es den Zellen moglidi, die Position der Gewinner- 
zelle im Anordnungsraum zu ermitteln. Durch Vergleidi ihrer eigenen Position 
im Anordnungsraum mit der Position der Gewinnerzelle im Anordnungsraum 
konnen die einzelnen Zellen ihre Distanz (bzgl. eines beliebigen Distanzmafies) 
von der Gewinnerzelle im Anordnungsraum bestimmen. Die Zellen verwen- 
den nun diese Distanz, um durch XOM eine Aktualisierung ihrer Position im 
Ergebnisraum durchzufiihren. Mit Darbietung eines neuen Reizes begiimt der 
Vorgang von neuem. 

Wichtig ist, dafi die Zellen (je nach verwendeter topologieerhaltender Abbil- 
dung) ihre (relativen) Positionen im Erkundungs-, Anordnungs- bzw, Ergeb- 
nisraum bestimmen konnen. Dies kann z. B. durch Informationsaustausci in 
lokalen Umgebungen der Zellen in den verschiedenen Raumen erfolgen. Die 
Zellen uberpriifen die Konsistenz der Positionen, die sie in den verschiedenen 
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Raumen emnehmen, und tomgiereii diese entsprechend, entweder standig oder 
gelegentlich. 

Die Positionsbestiminuiig in den einzelnen Raumen Irann z. B. folgendermafien 
reaJisiert werden: Alle Zellen erzeugen ein oder mehrere 'Trodukte", z. B. Fel- 
der, chemische Substanzen oder beUebige Datenobjekte. Diese verteilen sich 
nach geeigneten Beredmungsvorschriften im jeweiligen Rauin. Ggf. klingen sie 
in Abhfingigkeit von der raumlichen und/oder zeitlichen Distanz zu ihrer Erzeu- 
gung ab bzw. verandem ihre Eigenschaffcai. Aufgrund der lokalai Bestimmimg 
der resultierenden Feldstarken, Substanzkonzentrationen oder Eigenschaften 
durch die einzebien ZeUen konnen diese ihre Position im jeweiUgen Raum be- 
stimmen. Denkbai ist hier z. B. audi eine raumriditungsabhangige Integra- 
tion fiber die Starke, Konzentration oder Eigensdiaffcen der Produkte, die in 
einzehien Zellen oder durdi Informationsaustausdi in lokalen Zellverbanden 
durdigefuhrt werden kann. 

Eine degante Form der Positionsbestammung im Anordnun^aum kann audi 
durdi XOM realisiert werden: Hierbei werden die Positionen der Zellen im 
Erkundungsraum bzw. Ergebnisraum als Anordnungsraum einer neuen topo- 
logieerhaltenden Abbildung varwendet und umgekehrt. Die Rx>llen von Erkun- 
dungsraiun bzw. Ergebnisraum und Anordnungsraum werden also im Sinne 
von Is vertausdit. Nadi Training der neuen topologieerhaltenden Abbildung 
«rhSlt man als Ergebnis SdiS-tzwerte der Zellpositionen im Anordnungsraum,, 
die mit den bislang in den Zellen gespeidief ten Zellpositionen im Anordnungs- 
raum vergUdien werden kSnnen. Letztere kSnnen dann ggf. geeignet aktuali- 
siert werden. 

In Abhangigkeit von derartigen Positionsbestimmungen und Konsistenzpriifun- 
gen kSnnen dann audi lokale oder globale Korrekturen der Zellzahl oder Zd- 
leigensdiaften im Organismus vorgenommen werden. Hierzu konnen ggf. neue 
ZeUen erzeugt oder existierende ZeUrai zerstort oder verandert werden. Ein glo- 
bales KorrekturmaS ist zum Beispid die Gesamtzahl der ZeUen im Vergleidi 
zur Gesamtzahl der Datenobjekte im Anordnungsraum. 

WesentUdi ist, daB derartige korrekturmotivierende KonsistenzmaBe aus Krite- 
rien der AbbUdungsqualitat topologieerhaltender AbbUdungen gewonnen wer- 
den konnen, wie sie z. B. in 2 aufgefuhrt werden. Insbesondere sind hierbd 
Mafie zur BeurteUung der lokalen oder globalen Topologieerhaltung widitig. 
Wird bdspidsweise, wie oben besdirieben, eine Positionsbestimmung der Zel- 
len im Anordnungsraum durch XOM vorgenommen, so kann Wissen fiber die 
Starke und/oder die Art lokaler Topologieverletzungen dazu verwendet werden, 
um lokale Korrekturen im Hinblidc auf Zellzahl und Zelleigensdiaften durdi- 
zufiihren. Wird umgekehrt durdi XOM eine Positionsbestimmung der Zelle im 
Erkundungs- bzw. Ergebnisraum durdigefuhrt, so kSnnen auf der Basis derar- 
tiger Konsistenzmafie ebenfalls entsprediende Korrekturen, z. B. im Sinne von 
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Im, In Oder Iq. 

Eine charakteristische Eigenschaffc deraxtiger auf XOM basierender Systeme ist, 
dafi bei gleicher oder ahnlicher Zellausstattung jede Zelle gnindsatzlich jeden 
Ort bzw. jede Punktion im Organismus ubemehmen kann, d. h. insbesonde- 
re auch verandem kann. Die Gesamtstruktur und -funktion des Organismus 
bleibt hierbei im wesentlichen miverandert. Die einzelnen Zellen in derartigen 
Verfahren imd Vorrichtungen erinnem somit an "pluripotente Stammzellen" in 
der Biologie, Allerdings kann diese Flexibilitat der ZeUen auch eingeschrankt 
werden, was im Hinblick auf die Ahnlichkeit mit biologischen' Systemen auch 
als "Zelldifferenzierung"' bezeichnet werden kann. 

Der Erkundungsraum kann am ehesten als "Korper" interpretiert werden im 
Sinne eines Raumes, den der Organismxis einnimmt. Ist dieser veranderlich oder 
aufieren Einfliissen unterworfen, so kann sich der Organismus durch adaptives 
Training der topologieerhaltenden Abbildung gemafi XOM selbst stabilisieren, 
bzw- an die neuen Bedingungen des Lebensraumes anpassen. 
Werden Teile derartiger auf XOM basierender Systeme entfemt bzw. zerstort, 
so konnen sich die Systeme unter Ruckgriff auf die oben beschriebenen Vorgange 
regenerieren. Werden solche Systeme in zwei oder mehrere Teile geteilt, so 
konnen sich axis den einzelnen Teilen wieder gesamte Organismen entwickeln. 
Diese Systeme verfugen also iiber die Fahigkeit zur Selbstregeneration und 
Selbstreproduktion, wobei Selbstregeneration als Voraussetzung fiir die Selbstre- 
produktion durch Teilung des Organismus gewertet werden kann. Aus jeweils 
kleinen Teilen des Organismus bzw. wenigen oder einzelnen Zellen kann ein 
neues System entstehen, das alle Eigenschaften des Gesamtorganismus besitzt, 
u. a. auch seine Form bzw. Gestalt. Somit kann man durch XOM Verfahren 
und Vorrichtungen mit der Fahigkeit zur Gestaltbildung bzw. Morphogenese 
konstruieren bzw. auch Selbstorganisationsprozesse in Natur und Tedmik si- 
mulieren. Der Schutzanspruch dieses Patents bezieht sich auf beides, sowohl 
fiir einzelne Systeme als auch Ensembles solcher Systeme. 
Offensichtlich sind zahlreiche Erweitenmgen derartiger Systeme denkbar: So 
konnen Prinzipien aus dem Bereich der Biologie, insbesondere Genetik oder der 
evolutionaren Algorithmen verwendet werden, um oben beschriebene Verfahren 
und Vorrichtungen mit bestimmten Eigensdiaften zu "zuchten" bzw. weiter zu 
verbessern, sowohl auf der Bbene der einzelnen Zellen aJs auch der Organismen. 
So ware z. B. auch eine zwei- oder mehrfache Reprasentation des AnordnungSr 
raumes aJs "Bauplan" des Gesamtorganismus in jeder einzelnen ZeUe denkbar 
in Analogie zum diploiden Chromosomensatz in somatischen Zellen bei biolo- 
gischen Organismen sowie die Moglichkeit geschlechtlicher Fortpflanzung der 
Gesamtorganismen oder Zellen mit entsprechenden Vererbimgsschemata. 
Weiter sei betont, dafi die Informationsveraxbeitungin den beschriebenen XOM- 
Systemen auch hierarchisch erfolgen kann. Zum Beispiel kann das Training 
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tl^^^Tl ^"""^^ AbbUdung - ggf. in AbhSngigkeit vom jeweUigen Sy- 
s^^and bzw. Orgaaisationsniveau, z. B. einer geeignet zu de&uerendJn 
Leb^sphase d^ Orgaaismus' - unterschiedliche ffierarchiestufen durchlaufen 
t ic r Teilmengen der zu reprSsentierenden Datenobjek- 

V«i^ 1^;^°^ nT'^Tf S^^^Snete Berechnungsverfairen aus der 

WW Datenobjekte im Anordnungsraum gewoimene Mengen 'prototy- 
p^cher Datenobjekte'. Hier^ ka^ beispielsweise eine Vektorquantisierung d^ 
Anordnungsramnes durchgefuhrt werden. Insbesondere kann es hilfreich sein 
m den emzelnen ZeUen Infonnationen fiber unterschiedliche Anordnungs^Sume 
zu reprasentieren, die je nach Systemzustand fOr die XOM-AbbUdung verwen- 
^!!Tf ^"^f • ^r^^^^ durch ahnUche Verfeiren ist es in6glich 
zunadist die Grobstruktur und erst in spateren Phasen die Feinstruktif S 
Orgamsmus zu entwickeln. «ai«.i.iuji.i,ut aes 

^Si7r''*K*^? ^ Verfehren oder eine Vorrichtung im Sinne 

l^JZ^^fT"^"T ^OM-O^gaa^mus ist, dai3 Datenobjekten des Anord! 
dL SZtf-^^T'iT. "^"^ Anordnungsraum zugeordnet wird, die iiber 

^n§<ist nicht im Datenobjekt ent- 
SSit « f /Lf- Anordnungsraumes). Diese Infonnation 

dient lokal gespeidi^te Information fiber die Struktur des Gesamtsystems 
un Smne ernes vollstSndigen oder unvollstandigen "Bauplanea". DieS k^ 
obikJrLT !5 ^ °^^Sem Simie bzw. zugeordnete Da^ 

objekte des Anordnungsraimies, Ergebnisraumes und/oder Erkundmigsram^ 
zu erzeugen, zn entfemen oder zu verSndem. uaaungsraumes 

^iT^,f^H*^^^?^^' ^ ^^^^ ^^M ka^ das -Raining der topolo- 
giee haJtenden Abbildung unterschiedliche ffierarchiestufen durllaufen bet 

Sde'^IhhllH'"'^ ^"^"^ Teihnengen der durch die topoC^ril 
t^de Abbildung zu reprasentierenden Datenobjekte des Anordnun^aumes 
t'? Berechnungsverfahren aus der Verteilung der DatZS 

SVSn'^^^^r^r.f """""""^ ^^°een 'prototypischer Datenobjekte'. 
Di^ekomien z. B. durch Vektorquantisierung des Anordnungsraumes «zeugt 

SS'Zffv m5gUch, die Datenobjekte 

rP. Vp^ ? Verteilung im Anordnungsraum oder die Datenobjekte oder de- 
J^I E^^d^^Ssraum wShrend eines IVainiiigsvoriages oderS 

LaufeemerPolgevonTVainingsvorgangenzuverandem. S^soaerim 
(w) Testphase bei bereits trainierter XOM: ScMiefilich konnen nach abee- 

dt^TSS? "^"^"^ 5°^^ ^ ^OM verwendeten topoTo^e«hSt£ 

den Abbildung neue Datenobjekte ^m Anordnungsraum, E?kundmigsraum 

^Iffbh^'^^'i'"!?^''^^ Verwendtng diier topologS^- 

1, ^ ? "^r^ ^"""^ "^^S veraxbeitet werden, zum Beispiel 
zum Zwecke der Inter- oder Extrapolation, Approximation, Eiribettung^Ts^ 
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^.r.h S,^ ^^^"^^^^ Klassifikation, iiberwachten Abbildung 

^P^^?".^"*^"" R^lationan. Visualisierung oder Einsortierung oder iif 
R^en von Selbstorgaamtions- oder Morphogeneseprozessen. ffierbei konnen 
z. B. auch Verfaliren gemSfi Stand der Ttechnik zum Einsatz kommen. 

2. QuaUtatsbeurteilung: Bedeutsam sind Verfahren und VorrichWen zur Bestim 
SrtV^^^AKKMf AbbildungsquaHtat der gemSfiTS^t^^ 
logieerhaltenden AbbUdungen. Diese kann beispielsweise unteisucht ^den dJdiT 

SfM«firiT'? V«f*«il^Sferhaltung: ffierzu eignet sich die Bestiimnung 
der Te^.i V p "^'^ TopologieerhaJtung entsprechend dem Stand 

der Tedimk, z B. durch das sog. topographische Produkt gemafi [1] oder 
^rg eadibaxe Mafie^^e sie etwa in [24], Kapitel 10.3 und der dor^ ^ziS- 
ten Lateratur besdmeben sind. Eine Qualitatsbeurteilung kann auch erfoto 
durch Untersuchungen von Mafien der Verteilungserhaltmg. z. B.tog '^^^ 
zerrungsexponenten", die die Dichte der Codebuchobjekte i^ ErgebniJaumIL 
DatP^SS ^^Y"" ^'^'^ Datenobjekte im Erkundungsraum odeTdS 
?ir^3^ "° Anordnungsraum beschreiben konnen, z. B. L Sinne von [8] 

M^^rZ^^Tf^'' U^^^r^^g d« XOM-Abbildungsqualitat kann er- 
StLr von Verzerrungsmafien, wie z. B. der Kostenfunktion 

mchtbneaxer Embettungsverfahren. z. B. der Sammon-AbbUdung [40] oder von 

Sti^^iyr^ ''.^^"^^^""^ [11] Oder duxch'^rSnde 
Bjtmunung der Rangordnung nachster Nachbarn im Anordnung^ und Er- 

£ SToM7] * Datenobjekte un Erku^dung^al 

^""^ S,tKT^^°*' Die Untersuchung der XOM-AbbildungsquaJitSt kann erfolgen 
D^tir"^'"^'^^?^'' "Dista^zplots": ffierbei werd^^^ 

n-f"^"" Datenobjekten inx Ergebnisraum (oder Erkundungsraum) 
gegen die D^tanzen korrespondierender Datenobjekte im Anordnungsra^ 

rm Merkmalsraum emer selbstorganisierenden Kaxte gegenuber den pa^eT- 
k^fn^"^ ? korrespondierenden Positionsvektoren im ModeUcoS^L 
i^r^T V ^^^^ ^ unterschiedHchen Raumen konnen jedoch 

auch ohne graphische Daxstellung vergleichend anaJysiert werden. Auch wenn 
dies der Fallot wd der Einfachheit im folgenden dennoch von "DSJ^ot" 
fZ:: "^"^^ r^^^^^^S. jeweils aJIe berechenbaxen pa^eS Di- 

stanzen m den einzehien lUumen zu verwenden. Die Analyse kL z B erfo - 
furc^T^ H ' Betrachtmig und Interpretation des DiSa^zpS 

durch Berechnung von Mafien fur die "Breite" des Dista^lots. von Sati- 
on^^ zvnschen den Distaazen in den unterschiedlichen R^um^ ,TvoL 
Korrelationskoeffizienten oder Kovaxianzen oder durch Verfairen zu^ glob^en 
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(d. h. auf aJle Distanzpaare bezogenen) und lokalen (d. h auf einzelne Di- 
staazpaaxe bezog«aen) Dimensionsbestimmung des Distanzplots, z. B. im Sin- 
ne der HausdorffJ)iinension [18] oder Grassberger.Procaccia.Dimension [161 
Insbesondere sei betont, daB derartige Analysen selektiv flir unterschiedliche 
S^f^Tt'^^T^'^'' Dista^zen im ErkundTings-, Ergebnis-, und Anordnungs- 

ffv?^*^ ^ Dista^zen PaltungsphSnomene der topologie- 
erhaltenden AbbJdung (wie etwa in [36], Kapitel 14 beschrieben), f£ kle^^ 
Djtanzen lo^e Topologieverletzungen beobaxitet und quantitativ ausgewer! 
tet werden Die genannten oder ahnliche Mafie kfinnen auch als Instnmiente 
zur vergleichenden Bestimmung der Dimensionen von Datenverteilungen in den 
untersduedlichen Raumen verwendet werden. 

(d) Ergebnisplot bzw Erkundungsplot: Eine QuaJitatsbeurteilung fiir XOM 

P^'''''? .^'"""^^^ Analysieren eines PlL der Co- 

debudiobjelrte im Ergebmsraum bzw. diesen Codebuchobjekten entsprechen- 

ptL^H '"^"^v"^.^'^^^"^^^^' i^besondere wenn BrgebL- und 
Erkundungsranm uberemstimmen. Insbesondere konnen hierbei Datenobjekte 
und/oder topologische Beziehungen der zu den Codebuchobjekten korrespon- 
^erenden Datenobj^e des Anordnungsraumes durch VerbiidungsnSJoder 
S^J?'r?T^'c^**"' °der graphische Objekte Zter2i^. 

dter Dicke Eaxbe, Schattierung, Struktur. Textur) visuaMert und/oder a2 
b^a^ werden Besondersgeschutzt ist eine derartige DaxsteUung wenn sie 
mit der Darstdlung von Datenobjekten des Erkundungsraumes uS/oder Er! 
gebmsraumes bzw. deren topologischen Beziehungen kombiniert wkd Ganz 
besonders ist hier auch die DarsteUung der lokaJen Grofie von QuaJitatsma. 
iL%\rTft^ topologieerhaltenden Abbildung durch beUebige graphi- 
sche HJtottel hervorzuheben, z. B. bzgl. Verzemmg, Topologi^ odS Ver- 

dur^?S^±r ^''^^"^ Dista^plote und QuditftsbeurteiWg 

durch ub«n.ach es Lemen gewonnenen Informationen. Da die genaimten Dax 
steUungsarten em wesentUcher Aspekt der explorativen Analyse des Anord- 
nungsraumes bzw. seiner Topologie durch XOM ist, soUen sie durch das Pa. 
^mT-^'^^^?l*^* sein, insbesondere wemi der Anordnungsraum ganz 
Oder teilwase durch Emgabedaten bestimmt ist oder wemi der Erkundt^^ 

^^Tn^? '^f''"' ^^I. ^^""^^^ ^"^^ Strukturhypothesen bestimmt 
Jt. Die AusfuhiTingen dieses Punktes gelten allgemein fiir Datenobjekte und 
fur aus Datenobjekten neu berechnete Datenobjekte zugehorige Raumber^^e 

t^^M^^^'l^^'K^-'^^^^^^ ^^""^^ Datenobjekte des Erkundungsraumes 
^^f ^ Anordnungsraum visualisiert werdS Insbe- 

n r^K-^^'- °bj«kte und/oder toplogische Beziehungen der 

A '^^i-"^ Erkundungs- und/oder Ergebnisraum durch Verb^ 
dungshmen oder sonstige graphische Hilfemittel (Linien oder graphische Objek- 
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te unterschiedlicher Dicke, Farbe, Schattierung, Struktur, Textur) visualisiert 
und/oder analysiCTt werden. Besonders geschtitzt ist eine derartige Darstel- 
lung, wenn sie mit der DarsteUimg von Datenobjekten des AnordnungsraTimes 
bzw. deren topologischeii Beziehungen kombiniert wird. Ganz besonders ist 
hier auch die Darstellung der lokalen GrSfie von Qualitatsmafien der verwen- 
deten topologieerhaltenden Abbildung durch beliebige graphische Hilfemittel 
hervorzuheben, z. B. bzgi. Verzerrung, Ibpologie- oder Verteilungserhaltung 
sowie beziiglich aus Distanzplots und Qualitatsbeurteilung durch uberwachtes 
Lemen gewonnenen Informationen. Da die genannten Darstellungsarten ein 
■wesentlicher Aspekt der explorativen Analyse des Erkundungsraumes, des Er- 
gebnisraumes bzw. deren Eigenschaften durdi XOM ist, soUen sie durch das 
Patent besonders geschutzt sein, insbesondere wenn der Erkundungs- bzw. Er- 
gebnisraum ganz oder teilwdse durch Strukturhypothesen bestimmt ist oder 
wenn der Anordnungsraum ganz oder teilweise durch Eingabedaten bestimmt 
ist. Die Ausfiihiungen dieses Punktes gelten allgemein fiir Datenobjekte und 
fur aus Datenobjekten neu berechnete Datenobjekte bzw. Datenobjekten zu- 
geordnete Raumbereiche. 

(f) Qualitatbeiirteilung durch uberwachtes Lernen: Die XOM-Abbildungs- 
qualitat kann auch dadurch bestinamt werden, dafi sog. uberwachte Lernver- 
fahren eingesetzt werden, um die unterschiedlichen, an der topologieerhalten- 
den Abbildung beteiligten DatenrSume aufeinandfer abzubilden. ffierbei wird 
ein Lemverfahreh bzw. erne Lernvorrichtung durdi Paare von Datenobjekten 
trainiert, wobei ein Paar aus einem oder mehreren Quelldatenobjekten sowie 
einem oder mehreren Zieldatenobjekten besteht. Die Quelldatenobjekte sind 
hierbei einem Quellraum, die Zieldatenobjekte einem Zielraum entnommen. Ist 
das TVaining fortgeschritten oder abgeschlossen, kann in einer sog. Testphase 
bei Vorgabe von evtl. neuen QueUdatenobjekten ohne zugeh6rige Zieldaten- 
objekte unter Ruckgriff auf die trainierte Abbildung eine Schatzung fiir zuge- 
ordnete Zieldatenobjekte erhalten werden. Typische uberwachte Lernverfahren 
sind z. B. unterschiedliche neuronale Netze (z. B. Multilayer Peceptrons [38], 
Radiale-Basisfunktionen-Netzwerke [33], Support Vector Machines [6] sowie 
zahkeiche Varianten dieser Verfahren), lokale Modelle (z. B. [43], [29]), z. B. lo- 
kale Durchschnittsmodelle oder lokale lineare Modelle, sowie samtliche in der 
Literatur beschriebenen Approximations- oder Interpolationsverfahren. Auch 
topologieerhaltende Abbildungen kSnnen fiir uberwachtes Lemen eingesetzt 
werden, z. B. durch Aufispaltung des Erkundungsraumes in Quell- und Ziebaum 
bei selbstorganisierenden Karten gemafl Stand der Technik oder durdi Aufspal- 
tung des Anordnungsraumes in Quell- und Zielraum bei XOM (vgl. auch 7). 
Legt man die drei Raume Erkundungsraum, Anordnungsraxun und Ergebnis- 
raum zugrunde, so tonn grundsStzlich jeder der drei Raume aJs QueUraum oder 
aJs Ziehraum dienen. Palls man Quell- und Ziehraum unterschiedUch wShlt, er- 
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geben ach somit zunachst sechs Moglichkeiten fiir das uberwachte liaining 
von AbbUdungen zwischen den drei Datenraumen. Allerdings sind auch b^ 
hebi^ Verkettungen dieser AbbUdungen denkbar, wobei der Quellraum auch 
dem Ziebaum entsprechen kann. Die AbbUdungsqualitat von XOM kann nun in 
der Testphase der iiberwacht trainierten Abbildung dadurch bestimmt werden 
da6 der geeignet zu quantifizierende AbbUdungsfehler, also die Abweichun^ 
zwischen 1st- and SoUwerten von Zieldatenobjekten. ermittelt wird. ffierzu 
konnen behebige Distanzmafie verwendet werden. Ein haufig in normierten 
Vektorraumen verwendetes Mafi ist z. B. die Summe der Differenzenquadrate 
zwischen 1st. und SoUwerten. Durch Bestimmung des Abbildungsfehlers von 
ubeiwht tramierten Lemverfairen und -vorrichtungen kann auf diese Weise 
,r ,-^?^-AbbildungsquaJitat lokal oder global bestimmt werden. Ein Spezi- 
alfall besteht darin, dafi eine Verkettung iiberwacht trainierter Abbildungen 
verwendet wird, wobei Quell- und Ziekaum der Verkettung izbereinstimmen 
Hier kaim dann z. B. die Abweichung von Quell- und Zieldatenobjekten nach 
tim- und Ruckprojektion in und von einem anderen Datenraum beobachtet 
una analysiert werden. 

(g) Qualitatsbeurteilung durch Interpolation, Extrapolation oder Ap- 
proxirnation, Hin- und Rfickprojektion: LetztUch kann die QuaJitatsbe- 
urteJung bei XOM durch Interpolation, Extrapolation oder Approximation 
vou Datenobjekten des Anordnungsraumes im Erkundungs. oder Ergebnisraum 
Oder durdi IntCTpoIation, Extrapolation oder Approximation von Datenobjek- 
ten des Erkundungs- oder Ergebnisraumes im Anordnungsraum oder durch 
Vergleich ernes Datenobjektes des Anordnungsraumes oder des Erkundungs- 
raumes mit seinem Bild nach Projektion und Riickprojektion durch geeignSe 
Verfahren der Interpolation, Extrapolation, Approximation oder des iiberwach- 
ten Lemens gemafi Stand der Technik oder dieser Patentschrift 

(h) QuaUtatbeurteUung durch Itajektorien oder "Blobs": Es sei betont 
dafi bei den aufgefuhrten und bei anderen Verfahren zur Beurteilung der XOM- 
Abbildunpqualitat Datenobjekte auch sequentieD prasentiert werden konnen, 
z. B. Datenobjekte im Erkundungsraum, wobei zeitlich aufeinanderfolgend 
prasentierte Datenobjekte eine geringe wechselseitige Distanz besitzen. Die 
Datenprasentation erfolgt dann auf 'stetigen' -najektorien im jeweiligen Da. 
tenraum, wobei zeitliche Naie auch ortliche Nahe bedingt. Auch ist eine Da- 
tenprasentafaon in Form von zeitlich und ortlich waademden "Erregungsberei- 
chMi , sog. Blobs" mogUch. Unter geeigneten Annahmen, z. B. Stetigkeitsan- 

^^^^SJT^i^? u "^^^^ ^"^e^ genannten Methoden 

zur XOM-Quahtatsbeurteilung, weitere Kriterien zur Beurteilung der AbbU- 
dungsqualitat bei XOM entwickehi, die auch die zeitliche Dynanuk der Daten- 
prasentation beriicksichtigen bzw. durch diese beeinflufit werden 
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. Dimensionsbestimmung: Durch topologieerhaltende AbbUdungen konnen Ver- 
fahren und Vorrichtungen zur lokalen Oder globalen Dimensionsbestimmung von 
DatenverteUungen konstruiert werden, insbesondere auch von DatenverteUungen 
mit fraktaler lokaler oder fraktaler globaler Dimension. Die Dimensionsbestimmung 
erfolgt hierbei dadurch, dafi zwei DatenverteUmigen miter Verwendung topologieer- 
haltender Abbildungen aufeinander abgebUdet werden, wobei eine den Anordnungs- 
ramn, die andere den Erkmidungsramm definiert oder beeinflnBt. Durch Analyse der 
Eigenschaften der trainierten topologieerhaltenden Abbildung, etwa im Sinne der 
Verfahren und Vorrichtungen gemafi 2, lassen sich dann Riickschlusse auf die Di- 
mensionen der verwendeten Verteilungen Ziehen, z. B. im Sinne eines Dimensionsver- 
gleichs. Derartige VerfaJbren und Vorrichtungen sind ein eigenstandiger Aspekt der 
vorUegenden Erfindung und unabhangig von der XOM-Definition. Sie lassen sich 
jedoch auch im Hinblick auf die in Abschnitt 2.1 au^efOhrten funktionellen und 
strukturellen Definitionen interpretieren, wenn man die dort eingefuhrte Dimension 
der "Emgabedaten" prSzise anwendet. ffierbei sind folgende Falle zu unterscheiden: 

(a) Die Dimension der Datenverteilung des Anordnungsraumes soli bestimmt wer- 
den, die Dimension der Datenverteilung des Erkundungsraumes ist bekannt: 
Als Emgabedaten fungieren hierbei die bekarmte Dimension der Datenvertei- 
lung des Erkundungsraumes und die DatenverteUung des Anordnungsraumes 
im Sinne von etwas 'Gegebenem, mit dem etwas gemacht werden soil'. Somdt 
ist die XOM-Definition anwendbar. 

(b) Die Dimension der Datenverteilung des Erkundungsraumes soli bestimmt wer- 
den, die Dimension der Datenverteilung des Anordnungsraumes ist bekannt. 
Als Emgabedaten dienen hier die Datenverteilung des Erkundungsraumes und 
die bekannte Dimension der DatenverteUung des Anordnungsraumes. Letztere 
ist somit ein Eingabedatenobjekt, womit die XOM-Definition anwendbar wird. 

(c) Die Dimensionen beider DatenverteUungen sind imbekannt, es soil lediglich em 
Dimensionsvergleich stattfinden. Beide DatenverteUungen sind somit Eingabe- 
daten, insbesondere auch die DatenverteUung des Anordnungsraumes. Somit 
ist die XOM-Definition anyrendbar. 

Ffir die beschriebene Dimensionsbestinamung durch topologieerhaltende AbbUdun- 
gen konnen grundsatzUch beUebige DatenverteUungen benutzt werden. Als Referenz- 
verteUungen mit bekannter oder berechenbarer Dimension seien hier insbesondere 
^annt: (i) die in [27] beschriebenen und zitierten Raktale (ii) Attraktoren von 
Differentialgleichungen und Differentialgleichungssystemen, insbesondere "chaoti- 
sch^' und "seltsame" Attraktoren, z. B. Lorenz-Attraktor, Rossler-Attralctor, Ueda^ 
Duffing-Attraktor, AttraJctor der Mackey-Glass-Differentialgleichung (Differential- 
delay equation) etc. sowie (iu) Attraktoren von iterativen AbbUdungen, insbeson- 
dere "chaotische" und "seltsame" Attraktoren, z. B. Sinai map, Circle map, Sine 
map, Shift map. Tent map. Logistic map, Henon map, Chirikov map etc. Im Hin- 
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blick auf (ii) und (iii) konnen samtliche in der Literatur zu chaotischen Systemen 
und nichtlinearer Dynamik beschriebenen Attraktoren zur Dimensionsbestimmung 
durch topologieerhaltende AbbUdungen verwendet werden, eine Literaturiibersicht 
findet sich z. B. unter ''http://www-chaos.umd.edu/publications/refereiices.html". 
Es sei insbesondere im Hinblick auf (i) betont, dafi es in vielen Fallen eines spezi- 
ellen Vorgehens bedarf, urn eine Dimensionsbestimmung durch topologieerhaltende 
Abbildungen durchfuhren zu kdnnen. So sind die in [27] angegebenen Hausdorff- 
Dimensionen vielfach analytisch berechnete Werte, die sich auf die ideallypischen 
fraktalen Objekte beziehen. Diese enthalten i. a unendlidi viele Datenpunkte und 
entziehen sich somit der exsJcten Simulation auf Datenverarbeitungsanlagen. Er- 
zeugt man nun beispielsweise durch rekursive Abbildungsvorschriften sdbstShnli- 
che PunktverteUungen fiber mehrere Rekursionsstufen gemafi den in [27] angege- 
benen Berechnungsvorschriften, so erhalt man haufig Datenverteilungen, die eine 
sehr grofie Anzahl an Datenpunkten besitzen. Reduziert man die Anzahl der Re- 
kursionsstufen, so erhalt man zwar eine geringere Anzahl an Datenpunkten, die 
resultierende Verteilimg besitzt jedoch andere Eigenschaften als das ideallypische 
Praktal, insbesondere kann die Hausdorff-Dimension erhebUch von der Dimraisi- 
on des idealtypischen FVaktals abweichen. Dies ist vielfach dadurch bedingt, dafi 
die Selbstahnlichkeit fiber mehrere Rekursionsstufen die fraktale Dunension we- 
sentUch bestimmt. Der besondere THck besteht nun darin, das Fraktal zunachst 
fiber zahlreiche Rekursionsstufen zu berechnen und dann eine zufallige Auswahl 
der errechneten Datenpunkte zu treffen. Um die Dimension der resultierenden Dar 
tenverteilung experimentell zu bestimmen und ggf. Abweichungen vom theoretisch 
vorhergesagten Wert zu erfassen, eignet sich besonders die Bestimmung der Korre- 
lationsdimension nach Grassberger-Procaccia [16]. Besonders geeignet zur Dimensi- 
onsbestimmung mit topologieerhaltenden AbbUdungen sind Datenverteilungen, de- 
ren Dimension systematisch, d. h. durch Veranderung eines Oder mehrerer Parame- 
ter in einem bestimmten Bereich "durchgestimmt" bzw. eingestellt werden kann. 
Als Beispiel seien die diesbezuglich in [27] genannten Systeme, z. B. fraktale Tep- 
piche, Schwamme, Schaume, Netze, Gitter oder Koch-Inseln und -Seen sowie die 
Mackey-Glass-Differentialgleichung (Differential-delay equation) [26], deren Attrak- 
tordmiension von der Zeitverzogerung abhangt. Es seien noch einige spezielle FSlle 
der Dimensionsbestimmung durch topologieerhaltende Abbildungen genannt: 

(a) Dimensioiasbestimmung im Anordnungsraum: Dimensionsbestimmung 
der Datenverteilung im Anordnungsraum einer topologieerhaltenden Abbil- 
dung auf der Basis der unter Punkt 1 aufgefiihrten Verfahren und Vorrichtun- 
gen, insbesondere durch die unter Punkt 2 aufgefuhrten Verfahren und Vorrich- 
tungen, insbesondere durch wiederholte Anwendung der unter 1 aufgefuhrten 
Verfahren und Vorrichtungen, mit Datenverteilungen im Erkimdungsraum von 
bekannter, ggf. jeweils unterschiedlicher Dimension 
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(b) Dimensionsbestimmung im Anordnungsraum: Dimensionsbestimmung 
der Datenverteilung im Erkimdungsrauin einer topologieerhaltendeii Abbil- 
dung auf der Basis der unter Punkt 1 aufgefuhrten Verfahren und Vorrichtun- 
gen, insbesondere durch die unter Punkt 2 aufgefuhrten Verfahren und Vorrich- 
tungen, insbesondere durch wiederholte Anwendung der unter 1 aufgefuhrten 
Verfahren und Vorrichtungen, mit Datenverteilungen im Anordnungsraum von 
bekannter, ggf. jeweils unterschiedlicher Dimension 

(c) Dimensionsvergleich: Dimensionsvergleich auf der Basis der unter Punkt 1 
aufgefuhrten Verfahren und Vorrichtungen, insbesondere auch mittels Aus- 
tausch der Datenverteilimgen von Anordnungsraum und Erkundimgsraum, d. h. 
wechselseitige Einbettung, wobei die Dimensionen einer oder beider Datenver- 
teilungen auch unbekannt sein konnen, insbesondere durch die imter Punkt 2 
aufgefuhrten Verfahren und Vorrichtungen, insbesondere auch Anordnxmg von 
mehr als zwei Datenverteilungen im Hinblick auf ihre Dimension durch paar- 
weisen Dimensionsvergleich 

Wichtig fiir die Dimensionsbestimmung durch XOM ist, daB samtliche in dieser 
Patentschrift imd insbesondere in 1 und 2 aufgefuhrten XOM-Modifikationen und 
Evaluationstechniken eingesetzt werden konnen. 

4. Binbettimg: Durch XOM lassen sich leistungsfahige Verfahren und Vorrichtun- 
gen, insbesondere gemafi den Beschreibungen in Pimkt 1 zur nichtlinearen Einbet- 
tung von Datenobjekten bzw. deren Verteilungen im Anordnungsraum in beliebige 
Datenobjekte bzw. deren Verteilungen im Erkundungsraum realisieren, Typischer- 
weise wird hierbei der Anordnxmgsraum einer topologieerhaltenden Abbildung aus 
den einzubettenden Eingabedaten konstruiert, Im einfachsten Fall werden die Ein- 
gabedaten hierzu direkt verwendet, es ist jedoch auch moglich, die Eingabedaten 
durch Berechnungsvorschriffcen zu verarbeiten, bevor sie in den Anordnxmgsraum 
eingespeist werden. Auch ist es moglich, dafi der Anordnungsraum nicht vollstandig 
durch die Eingabedaten bestimmt ist. Die letztlich im Anordnungsraum vorliegen- 
den Daten werden als Ursprungsdaten bezeichnet. Als Einbettungsraum dient ein 
beliebiger Erkundungsraum, dieser ist typischerweise durch Strukturhypothesen be- 
stimmt, jedoch kann er auch durch Eingabedaten oder beides enthalten bzw. beein- 
flufit werden. Einbettungen durch XOM konnen z. B. zur explorativen Datenana- 
lyse und/oder Visualisierung der Ursprungsdaten oder zur Datenreduktion der Ur- 
sprungsdaten dienen, insbesondere wenn der Erkundungsraum einfacher und/oder 
von geringerer Dimension als der Datenramn der Ursprungsdaten gewahlt wird. Es 
kann jedoch auch sinnvoll sein, die Dimension des Erkundungsraumes grofier als die 
des Anordnungsraumes zu waMen, z. B. um Dimensionsschatzungen durchzufuhren 
Oder Auffaltungsphanomene zu beobachten, vgl. hierzu auch die Pimkte 3 und 2. 
Wesentliche Aspekte der Einbettung durch XOM sind, 

(a) dafi insbesondere auch Datenobjekte, Verteilungen von Datenobjekten bzw. Dar 
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tenraxune ^gebettet werden konnen, fur die beliebige Distanzmafie gdten, al- 
so i a. die Distanzen zwisdxen den Datenobjekten dieser Verteilungen durch 
beliebige Distanzma6e definiert sein konnen, auch soldxe, die im mathemati- 
schen Sinne keine Metrik bilden. Hier wird besonders auf die Punkte le, If und 
Ig verwiesen. Die Binbettung von beliebigen, insbesondere auch nichtmetri- 
schen Datenverteilimgen, wobei diese Datenverteilungen beziiglidi beliebiger 
Distanzmafie die Topologie des Anordnungsraumes topologieerhaltender Ab- 
bildungen bestimmen, ist ein zentraler Aspekt der Erfindung. Bin besonders 
wichtiger SonderfeJl sind paarweise, ggf. nichtmetrische Dissimilaritaten von 
Datenobjekten. 

(b) dafi insbesondere auch Datenobjekte, Verteilungen von Datenobjekten bzw. Da- 
tenraume mit fraktaler lokaler oder globaler Dimension eingebettet werden 
konnen, vgl. auch die Ausfuhrungen in Punkt 3. 

(c) dafi insbesondere auch Datenobjekte, Verteilimgen von Datenobjekten bzw. Da- 
tenraume eingebettet werden konnen, die vollstandig oder teilweise liber Di- 
stanzobjekte definiert sind, fiir die also z. B. lediglich paarweise Distanzen, 
nicht jedoch metrische Einbettungen bekannt sind, insbesondere zimi Zwecke 
der Berechnung von metrischen Einbettungen. 

(d) dafi insbesondere auch Umskalierungen der Distanzen im Anordnungsratmi im 
Sinne von Ir, z. B. als Sparseness Annealing, sowie samtliche in dieser Pa- 
tentschrift und insbesondere in 1 aufgefiihrten XOM-Modifikationen eingesetzt 
werden k5nnen. 

(e) dafi das Einbettungsergebnis durch graphische Darstellimg in Form eines Er- 
gebnis- bzw. Erkundungsplots gemafi Punkt 2d visualisiert imd analysiert wer- 
den kann, , insbesondere auch zum Zwecke der nicbtlinearen Hauptkomponen- 
tenanalyse oder zur Visualisierung von Losungen von Optimierungsproblemen 
oder zur Visualisierungen von Datenpartitionierungen (Clusterergebnissen). 

(f) dafi das Einbettimgsergebnis durch graphische Darstellung in Form eines An- 
ordnungsplots gemafi 2e visualisiert imd analysiert werden kann, insbesondere 
auch zum Zwecke der nicbtlinearen Hauptkomponentenanalyse oder zur Visua- 
lisierung von Losungen von Optimierungsproblemen oder zur Visualisierungen 
von Datenpartitionierungen (Clusterergebnissen), 

(g) dafi eine Qualitatsbeurteilimg des Einbettungsergebnisses gemafi Punkt 2 erfol- 
gen kann. Hierdurch lassen sich insbesondere auch Stnikturhypothesen bzgl. ge- 
eignet zu wahlender Brkundungsraume zielgerichtet, ggf. iterativ, verbessern. 

5. Datenpartitioniermig, Clustering: Durch XOM lassen sich leistimgsfahige Ver- 
fahren und Vorrichtungen zur scharfen und unscharfen Partitionierung bzw. zum 
Clustering von Verteilungen von Datenobjekten konstuieren, insbesondere unter 
Benicksichtigung der Beschreibimgen in Punkt 1. Bine Beispiel fiir eine typische 
Vorgehensweise sei im folgenden beschrieben: 
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(a) Wahle die Bingabedatenverteilung als AnordnungsraTim. 

(b) Wahle eine geeignete Strukturhypoth^e fiir den Erkundungsraum. Als belie- 
biges Beispiel sei hier eine Datenverteilung genaunt, die aus mehreren Gaufi- 
verteilimgen zusammengesetzt ist, deren Parameter ad hoc festgelegt werden. 
Die Schwerpunkte der GauSverteilungen konnen eine beliebig vorgegebene to- 
pologische Struktur besitzen, beispielsweise konnen sie auf einem regulaxen 
Gitter angeordnet sein. Man beachte, dafi fiir die Wahl der Datenverteilungen 
im Erkundungsraum keinerlei Einschrankungen bestehen, siehe insbesondere 
nachfolgend aufgefiihrte Punkte. 

(c) Trainiere die topologieexhaltende AbbUdung. 

(d) Ordne die Codebuchobjekte scharf oder unscharf den einzelnen Datenverteilun- 
gen des Brkund\mgsraumes zu, beispielsweise durdi Berechnung und Vergleich 
von Distanzen der einzelnen Codebuchobjekte zu den Schwerpunkten der ein- 
zelnen Datenverteilungen, die ja in diesem FaJl als GauSverteilungen gewahlt 
wurden. Durch Definition geeigneter DistaozmaBe, z. B. Likelihood, kann dies 
auch in unschaxfer Weise erfolgen, sowie in Fallen, in denen Ergebnisraum und 
Erkundungsraum nicht tibereinstimmen. 

Wesenthche Aspekte fur Datenpartitionierung bzw. Clustering durch XOM sind, 

(a) dafl insbesondere auch Datenobjekte, Verteilungen von Datenobjekten bzw. Da- 
tenraume geclustert werden koimen, fiir die beliebige Distanzmafie gelten, also 
i a. die Distanzen zwischen den Datenobjekten dieser Verteilungen durch be- 
liebige Distanzmafie definiert sein konnen, auch solche, die im mathematischen 
Sinne keine Metrik bilden. Hier wird besonders auf die Punkte le, If und 
Ig verwiesen. Das Clustering von beliebigen, insbesondere auch nichtmetri- 
schen Datenverteilungen, wobei diese Datenverteilungen beziiglich behebiger 
Distanzmafie die Topologie des Anordnungsraumes topologieerhaltender Ab- 
bildungen bestimmen, ist ein zentraler Aspekt der Erfindung. Ein besonders 
wichtiger Sonderfall sind paarweise, ggf. nichtmetrische Dissimilaritaten von 
Datenobjekten. 

(b) dafi insbesondere auch Datenobjekte, Verteilungen von Datenobjekten bzw. Da- 
tenraume mit fraktaler lokaler oder globaler Dimension geclustert werden kon- 
nen, vgl. auch die Ausfiihrungen in Punkt 3. 

(c) dafi insbesondere auch Datenobjekte, Verteilungen von Datenobjekten bzw. Da- 
tenraume geclustert werden konnen, die voUstandig oder teilweise iiber Distan- 
zobjekte definiert sind, fiir die also z. B. lediglidi paiarweise Distanzen, nicht 
jedoch metrische Einbettungen bekannt sind, insbesondere zum Zwecke des 
Clustering in metrischen Einbettungen. 

(d) dafi fiir die Wahl der Datenobjekte und Verteilungen sowie deren Parameter 
im Erkundimgsraum keinerlei Einschrankungen bestehen. 
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(e) da6 dieses insbesondere durch Training der topologieerhaltenden Abbildung 
mit einer naturlichen Zahl identischer, ahnlidier oder iinterscliiedlicher Da- 
tenverteilungen im Merkmalsraum mit jeweils unterschiedlichein Schwerpunkt 
bzw. Median erfolgen kann. 

(f ) dafi dieses insbesondere erfolgen kann durch harte oder unschaxfe Zuordnung 
einzelner Datenobjekte zu Clustem durch ein Kriterium, welches sich auf die 
durch ein beliebiges Distanzmafi bestimmten Distanz (z. B. Minimal distance) 
des zum Datenobjekt zugehorigen Codebuchobjekts von den Schwerpunkten 
oder anderen charakteristischen Orten der Datenverteilungen (z. B. Median) 
im Erkundungsraum bezieht, z. B. die Likelihood (z. B. Maximum likelihood) 
der Positionierung des Codebuchobjekts bei bekannter Struktur der Datenver- 
teilungen im Erkundungsraum oder irgendeine andere Berechnungsvorschrifb, 
der die voUstandige oder partielle Kenntnis der Verteilungsftmktionen im Er- 
kundungsraum zugrundeliegt. 

(g) dafi es sich bei der Wahl der Datenobjekte und Verteilungen im Erkundungs- 
raum insbesondere handeln kann um: einfache geometrische Objekte (z. B. Po- 
lygene, einfache geometrische Korper, Geradenstucke, Kreise, Ringe, Kugeln 
etc.), beliebige charakteristische Verteilungen, d. h. lokalisierte Gleichverteilun- 
gen, Normalverteilungen, Laplaceverteilungen, Poissonverteilungen, Binomial- 
verteilungen, hypergeometrische Verteilungen, r^-Verteilungen, Student'sche 
t- Verteilungen, Fisher'sche Verteilungen, Gammaverteilungen, Fisher'sche 
Z-Verteilungen, Kolmogorow-Smimow'sche A-Verteilungen (Definitionen [5]) 
oder um einzelne Datenobjekte im Sinne von Delta-Peaks. 

(h) dafi die Schwerpunkte oder andere ortliche Kenngrofien der Datenverteilun- 
gen im Erkundungsraum, z. B. die Mediane, im Erkundungsraum paarweise 
aquidistant angeordnet smd, z. B. auf einem diskreten, periodischen Gitter. 

(i) dafi insbesondere eine echte oder unechte Teikaenge der Gewichte, z. B. An- 
zahl der zu den einzelnen Verteilungen gehorenden Datenobjekten, oder die 
Streumafie (Momente) oder beliebige andere Parameter der Datenverteilungen 
im Erkundungsraum identisch oder ahnlich sein konnen. 

0) dafi insbesondere die Schwerpunkte der Datenverteilungen im Erkundimgsraum 
bei Vorgabe von n G IN Verteilungen auf den Ecken eines regularen Simplex 
im Erkimdtingsraum liegen konnen, dessen Dimension mindestens n - 1 ist 

(k) dafi insbesondere Anzahl, Struktur, Lokalisation, Dimension, relative oder ab- 
solute Gewichte oder beliebige Parameter der Datenverteilungen im Erkun- 
dungsraum wahrend eines Trainingsvorganges oder bei wiederholten Trainings- 
vorgangen der topologieerhaltenden Abbildung veranderlich gewahlt werden 
konnen, insbesondere dafi diese variiert werden kSnnen, um ein Qualitatskrite- 
rium gemafi den Punkten 2 oder 6 zu optimieren. Insbesondere konnen wahrend 
eines Trainingsvorganges oder bei wiederholten Ttaininggvorgangen Streumafie 
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der Verteilnngen im Brkundungsraum systematisch veranderlich gewahlt wer- 
den, z. B. um eine zuneliinende Fokussierung der Datenobjekte auf einzelne 
Cluster zu begiinstigen, d. h. um die Entropie der Verteilung der Datenobjekte 
auf die Cluster zu verringem. 

(1) dafi insbesondere audi Umskalierungen der Distanzen im Anordnungsraum im 
Siime von Ir, z. B. als Sparseness Annealing, sowie samtliche in dieser Pa- 
tentschrift und insbesondere in 1 aufgefiihrten XOM-Modifikationen eingesetzt 
werden konnen. 

(m) dafi Ergebnisse des Clustering durch graphische Darstellung in Form eines 
Ergebnis- bzw. Erkimdungsplots gemaB Punkt 2d visuaJisiert und analysiert 
werden konnen, Hier sind insbesondere auch Daxstellungen geschiitzt, die Clu- 
stergrenzen bzw. Tessdierungen chaxakterisieren oder die durch beliebige gra- 
phische Hilfemittel die ZugehSrigkeit von Datenobjekten zu Olustem keim- 
zeichnen. 

(n) dafi Ergebnisse des Clustering diurch graphische Darstellung in Form eines An- 
ordnungsplots gemafi 2e visualisiert und analysiert werden konnen. Hier sind 
insbesondere auch Daxstellungen geschiitzt, die Clustergrenzen bzw. Tesselie- 
rungen chaxakterisieren oder die durch beliebige graphische Hilfsmittel die Zu- 
gehorigkeit von Datenobjekten zu Clustern kennzeidmen. 

(o) dafi eine Qualitatsbeurteilung der Ergebnisse des Clustering gemafi Punkt 2 
erfolgen kann. Hierdurch lessen sich insbesondere auch Strukturhypothesen 
bzgl. geeignet zu wahlender Erkimdungsraume zielgerichtet, ggf. iterativ, ver- 
bessern. 

(p) dafi das Clustering hieraxchisdi erfolgen kann, insbesondere im Hinblick auf 
Punkt Iq, z. B. durch sich dynamisch sukzessiv aufspaltende Verteilimgen im 
Brkundungsraum wahrend eines Trainingsvorganges oder im Laufe mehrerer 
Trainingsvorgange der topologieerhaJtenden Abbildung. 

6. Clustervaliditat: Unter Clustervaliditat versteht man das Problem, den zu clu- 
sternden Datenverteilungen angemessene Strukturhypothesen zu definieren und/oder 
die Qualitat gegebener Partitionierungen von Daten im Hinblick auf diese Struk- 
turhypothesen zu beurteilen, insbesondere im Hinblick auf Anzahl und/oder relati- 
ves Gewicht der Cluster, auf die Wahl von Initialisierungsstrategien und/oder Wahl 
der angewandten Clusteringmethode. Zum Problem der Clustervaliditat sowie zahl- 
reichen Losungsversuchen vgl. z. B. [31]. 

Ein wesentlicher eigenstandiger Aspekt der Erfindung bezieht sidi daxauf, dafi im 
Gegensatz zum Stand der Technik Verfahren zur Bestimmung der Clustervaliditat 
auf Dissimilaxitatsdaten vorgeschlagen werden. Ein solches Verfahxen iSfit sich tedi- 
nisch folgendermaSen chaxakterisieren: 
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Verfahren zur Datenverarbeitung fur die Bestimmung der Clustervaliditat, bei dem 
Datenobjekte eingegeben werden, Distanzobjekte zwischen diesen Datenobjekten 
eingegeben und/oder berechnet werden, sowie eine Zuordnung der zu verarbeiten- 
den Datenobjekte zu Gruppen eingegeben und/oder berechnet wird, insbesondere 
gemafi in dieser Patentsdirift dargestellten Verfahren, und ein Mafi fiir die Qualitat 
dieser Zuordnung als Ausgabedaten ausgegeben wird, wobei das Mafi fiir die Qua- 
litat der Zuordnung unter Verwendung von wenigstens einem Tteil der eingegebenen 
und/oder berechneten Distanzobjekte berechnet wird. Im Hinblick auf den BegrtflF 
'TDistanzobjekt" gilt obige Definition. Es sei noch einmal besonders betont, dafi in 
dieser Definition insbesondere Distanzmafie eingeschlossen sind, die im mathemati- 
schen Sinne keine Metrik definieren. 

Als konkrete Realisierungen derartiger Verfahren werden zwei Vorgehensweisen vor- 

geschlagen: 

Einerseits konnen GlustervaliditatsmaBe fiir Dissimilaritatsdaten entwickelt werden, 
die auf Kostenfunktionen beruhen, die fur Verfahren zum Clustering von Dissimi- 
laritatsdaten verwendet werden. Fiir Beispiele derartiger Kostenfunktionen sei auf 
die Literatur zu Verfahren zum Clustering von Dissimilaritatsdaten verwiesen, ins- 
besondere [21], [13], [14], [15] sowie die in diesen Arbeiten zitierte Literatur. 

Beispielsweise kann man Verfahren und Vorrichtimgen zur Bestimmung der Cluster- 
validitat entwickeln, indem man zweite Differenzen der Kostenfunktionen, die fur 
Verfaluren zum Clustering von Dissimilaritatsdaten verwendet werden, berechnet, 
beispielsweise zweite Differenzen der Kostenfunktionen in Abhangigkeit von der Je- 
wells verwendeten Anzahl von Clustem. Relative oder absolute Maxima der Grofle 
dieser zweiten Differenzen konnen als Clustervaliditatskriterium verwendet werden. 
Als zweite Vorgehensweise lassen sich durch XOM leistungsfahige Verfahren. und 
Vorrichtungen zur Beurteilung der GlustervaUditat bei der scharfen und unscharfen 
Partitionierung bzw. beim Clustering von Verteilungen von Datenobjekten konstru- 
ieren, insbesondere imter Benicksichtigung der Beschreibungen in Pimkt 1, 5 und 
2. 

Eine Beispiel fur eine typische Vorgehensweise bei der Glustervaliditatsbestimmung 
durch XOM sei im folgenden beschrieben: 

(a) Definiere ein Clustervaliditatskriteri\xm, z, B. gemafi 2. 

(b) Fiihre ein Clustering gemaB 5 durch. 

(c) Analysiere die Ergebnisse des Glustermg im Hinblidc auf dieses Kriterium, 

(d) Andere die Strukturhypothesen fiir das Clustering, d. h. die fur das Clustering 
gewahlten Datenverteilungen im Erkundimgsraum. Wiederhole Clustering und 
Analyse im Hinblick auf das Kriterium, evtl. mehrmals, z. B. im Hinblick auf 
eine Optimierung der Clusterergebnisse beziiglich des Kriteriimis. 
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Einfache xind wichtige Beispiele fur Clustervaliditatskriterien sind die in 2 genannten 
Mafie zixr Analyse der Verzerrung, der Topologie- und Verteilungserhaltimg sowie 
die aus Distanzplots oder der Qualitatsbeurteilimg durch uberwachtes Lemen ge- 
wonnenen MaBe. 

Wesentliche Aspekte der Glustervaliditatsanalyse durch XOM sind, 

(a) dafi sie insbesondere auch fur nichtmetrische Datenverteilungen dxirchgefiihrt 
werden kann. Sie kann fur beliebige Datenobjekte, Verteilungen von Datenob- 
jekten bzw. Datenraumen durchgefuhrt werden, insbesondere diejenigen, die 
durch XOM gedustert werden konnen. Die diesbeziiglichen Bemerkungen im 
Punkt 5 gelten in vollem Umfang. 

(b) dafi sie insbesond^e auf der Basis aller Verfahren und Vorrichtungen aus 
Punkt 2 durchgefuhrt werden kann. 

(c) dafi sie auch benutzt werden kann, um die Qualitat einer vorgegebenen, d. h. 
nicht durch XOM-Clustering ermittelten Datenpartitionierung zu beurteilen. 

(d) dafi eine Visualisierung derartiger Analysen in Form von Erkundungs-, Ergeb- 
nis-, und Anordnungsplots im Sinne von 2 erfolgen kann, hierbei kann insbe- 
sondere auch eine bekannte oder berechnete Datenpartitionierung visualisiert 
werden, z. B, indem die Zuordnung von Datenobjekten zu Clustem visualisiert 
wird. Zusatzlich kann eine graphische Darstellung der ClustervaliditatsmaSe in 
Abhangigkeit von den Strukturhypothesen bzw. von deren Parameter erfolgen. 
Typischerweise konnen Clustervaliditatsmafie z. B. in Abhangigkeit von der 
Anzahl der vorgegebenen Cluster dargestellt werden. 

(e) dafi bei wiederholter DurchflihruAig derartiger Analysen nicht nur die Anzalil 
der Cluster verandert werden kann, sondern beliebige Strukturhypothesen, ins- 
besondere konnen auch Sdiemata des hierarchischen Clustering, vgl. Punkt 5, 
angewandt werden, 

7. Uberwachtes Lernen: Durch XOM konnen Verfahren und Vorrichtungen fur liber- 
wachtes Lemen, insbesondere zum Zweck der Pnnktionenapproximation oder Punk- 
tioneninterpolation, zur Zeitreihenanalyse oder Zeitreihenvorhersage, zur GlSttung 
oder Filterung konstruiert werden. Bei iiberwachtem Lemen wird ein Lemverfah- 
ren bzw. eine Lemvorrichtung durch Paare von Datenobjekten trainiert, wobei ein 
Paar aus einem oder mehreren Quelldatenobjekten sowie einem oder mehreren Ziel- 
datenobjekten besteht. Die Quelldatenobjekte sind hierbei einem Quellraixm, die 
Zieldatenobjekte einem Zielraum entnommen. 1st das Training fortgeschritten oder 
abgeschlossen, kann in einer sog. Test- bzw. Arbeitsphase bei Vorgabe von evtl. neu- 
en Quelldatenobjekten ohne zugehorige Zieldatenobjekte unter Riickgriff auf die 
trainierte Abbildung eine Schatzung fiir zugeordnete Zieldatenobjekte erhalten wer- 
den. Typische iiberwachte Lemverfairen sind z. B. unterschiedliche neuronaJe Netze 
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(z, B. Multilayer Peceptrons [38], Radiale-Basisfunktionen-Netzwerke [33], Support 
Vector Madunes [6] sowie zahlreiche Varianten dieser Verfahren), lokale Modelle 
(z. B [43], [29]), z. B. lokale DurchschBittsmodelle oder lokale lineare Modelle, sowie 
samtliche in der Literatur beschriebenen Approximations- oder Interpolationsver- 
fahren. 

Uberwachtes Lemen durch XOM kann xniter Verwendung aller durch diese Patent- 
schrift aufgefuhrten Aspekte realisiert werden, z. B. unter Rtickgriff auf die Beschrei- 
bungen in 1 sowie auch in Kombination mit der Verwendung von Interpolations- oder 
Approximationsmethoden gemaB Stand der Tedmik. 

Realisierungsmoglichkeiten sowie wesentliche Aspekte iiberwachten Lernens durch 
XOM sind, 

(a) dafi dieses insbesondere durch durch Aufspaltung des Anordnungsraumes in 
Quell- und Zielraum bei XOM erfolgen kann. Typischerweise wird hierbei der 
Anordnungsraum als Produktraum von Quell- und Zielraum definiert. Nun- 
mehr wird mittels XOM eine reprasentierende HypermannigMtigkeit der Da- 
tenverteilung gemaB Runkt 14 in diesem Produktraum konstruiert. In der Ar- 
beitsphase kann bei Vorgabe eines Quelldatenobjekts unter Kenntnis der Hy- 
permannigfaltigkeit ein Zieldatenobjekt ermittelt werden, indem die Koordina- 
ten des zum Quelldatenobjekt gehorenden Punktes der Hypermannigfaltigkeit 
im Zielraum erganzt werden. Diese Vorgehensweise kann z. B: zum Zweck der 
Punktionenapproximation oder Pimktioneninterpolation genutzt werden. 

(b) dafi dieses insbesondere tmter Verwendung von Verfahren und Vorrichtungen 
gemafi Punkt lo realisiert werden kann z. B. zum Zwecke der Punktionenap- 
proximation oder Funktioneninterpolation. 

(c) daB dieses insbesondere unter Verwendung von Verfahren und Vorrichtungen 
zum XOM-Clustering gemaB Punkten 5 realisiert werden kann. Hierzu werden 
typischerweise die durch XOM-Clustering erhaltenen Resultate als zusatzli- 
che Eingabe von Verfahren und Vorrichtungen fur uberwachtes Lemen gemafi 
Stand der Technik benutzt. Ein besonders wichtiger Spezialfall ist die Einspei- 
sung von XOM-Glusteringergebnissen beim Training von RadiaJe-Basisfunktio- 
nen-Netzwerken gemafi Punkt 21a. 

(d) dafi dieses insbesondere auch ziun Zweck des iiberwachten Lernens auf me- 
trischen oder nichtmetrischen DissimUaritatsdaten verwendet werden kann, 
z. B. zum Zwecke der Klassifikation auf derartigen Daten. Hierzu kann beispiels- 
weise ein XOM-Clustering gemafi 5 auf ggf. nichtmetrischen Dissimilaritatsda- 
ten durchgefiihrt werden. Die hierbei erhaltenen Clusteringergebnisse konnen 
dann beispielsweise id das Training eines Radiale-Basisfunktionen-Netzwerks 
eingespeist werden, etwa im Sinne von 21a. 
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(e) insbesondere auch in Kombination mit der Verwendimg von Interpolations- 
Oder Approximationsmethoden gemaS dem Stand der Tedmik oder den ande- 
ren Ansprilchen 

8. Registrierung: Durch XOM konnen Verfahren und Vorrichtungen fiir die Regi- 
strierung von Datensatzen realisiert werden unter Rtickgriff auf aUe Pnnkte dieser 
Patentschrift, insbesondere auf Punkt 1 sowie in Kombination von XOM mit Ver- 
fahren und Vorrichtimgen gemafi Stand der Technik. Insbesondere kann dadurch 
auch eine niditlineare, nichtafline, lokal verzerrende Registrierung von Datensatzen 
realisiert werden. 

Tjrpischerweise liegen im einfachsten Fall zwei Datenverteilungen zugrunde. Der 
sog. "Testdatensatz" soli auf einen "Referenzdatensatz" registriert werden. Dieser 
ist haufig dem Testdatensatz gemafi geeignet zu definierender Kriterien ahnlich. Ty- 
pischerweise sind Test- und Referenzdatensatz vorgegeben, es handelt sich also bei 
beiden mn Eingabedaten im Sinne von etwas "Gegebenem, mit dem etwas gemacht 
werden soil," Im einfachsten Fall wird nun einer der beiden Datensatze verwen- 
det, \mi den Anordnungsraum einer topologieerhaltenden Abbildung zu definieren. 
Der andere Datensatz wird hingegen verwendet, um den Brkundimgsraum dieser 
topologieerhaltenden Abbildung zu definieren. In jedem Pall werden Eingabedaten 
verwendet, um den Anordnungsraum teilweise oder vollstandig zu definieren. Somit 
ist die XOM-Definition anwendbar. 

Nach erfolgtem IVaining der topologieerhaltenden Abbildung kann die Qualitat des 
Registrienmgsergebnisses beurteilt werden, insbesondere unter Verwendung der Ver- 
fahren und Vorrichtungen aus Punkt 2. 

Wesentliche Aspekte der Registrierung durch XOM sind, 

(a) daJJ sie insbesondere zum Zwecke der Registrierung von - ggf. multispektralen 
Bilddatensatzen - in 2D und 3D, sowie von Bildfolgen eingesetzt werden kann. 

(b) dafi sie insbesondere zum Zwecke der Registrierung von Zeitreihen oder Zeit- 
funktionen eingesetzt w^den kann, z. B. im Sinne eines Dynamic Time War- 
ping (DTW), zur Definition von DTW vgl. z. B. [22]. 

(c) dafi sie insbesondere als Vorverarbeitung fur beliebige weitere Datenverarbei- 
timgsaufgaben, z. B. Klassifikation oder Clustering, im Sinne einer "Normah- 
sierung" verwendet werden kann. Hierbei werden imterschiedliche Datensatze, 
z. B. Bilddatensatze auf einen vorgegebenen Standaxddatensatz registriert. Ist 
beispielsweise auf dem Standarddatensatz ein Klassifikationsproblem - oder 
ein beliebiges anderes Datenverarbeitungsproblem - bereits ganz oder teilweise 
erfolgreich gelost, so kazm nach Registrierung diese Losimg auch fur die ande- 
ren Datensatze iibemommen werden. Ein beliebiges Beispiel ist die Segmentie- 
rung bestimmter Regionen in Bilddatensatzen des Gehirns dxurch Registrierimg 
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von Bilddatensatzen unterschiedlicher Individuen anf ein bereits segmentiertes 
"Normalhim" , weldies als Standarddatensatz dient. 

(d) da& Merdurch insbesondere Mafie fiir die lokale oder globale Ahnlichkeit zwi- 
schen verschiedenen Datensatzen gewonnen werden konnen, insbesondere nnter 
Verwendung der Verfahren xind Voirichtungen nach Pnnkt 2. 

(e) daB vor der Registriening auch eine Datenreduktion im Sinne einer Vektor- 
quantisierung durchgefahrt werden kann. 

(f) dafi Rand- oder sonstige Zusatzbedingungen fur die Registrierung durch sog. 
*^opologieanker" erzwiingen werden konnen. Hierbei handelt es sidi nm znsatz- 
liche Datenobjekte, die den zu registrierenden Datensatzen hinzugefiigt werden. 
Dies erfolgt in der Regel (i) in denjenigen Bereichen der Datensatze, die durch 
die Registrierung moglichst gut zur Deckung gebracht werden soUen, (ii) in 
den zu registrierenden Datensatzen auf ahnliche Weise. Diese Topologieanker 
werden in der Regel so gewaMt, dafi bei deren inkongruenter Registrierung 
hohe Kosten im Sinne von Mafien der AbbildungsquaUtat zu erwarten sind, 
z. B. gemafi den in 2 genannten Kriterien. 

9. Active Learning: Durch XOM konnen Verfahren und Vorrichtungen fur sog. "Ak- 
tives Lemen" realisiert werden unter Riickgriff auf alle Ptinkte dieser Patentschrift, 
insbesondere auf Pimkt 1 sowie in Kombination von XOM mit Verfahren und Vor- 
richtungen gemafi Stand der Technik. Hierunter versteht man eine Vorgehensweise, 
bei der wairend des Trainingsvorganges eines Lemverfahrens die Auswahl von Dar 
tenobjekten aus dem Trainingsdatensatz fCir das weitere Training unter Verwendung 
geeigneter Berechnungsverfahren durch den aktueUen Status des Lemverfahrens ge- 
zielt beeinflufit wird. 

Ein typisches Beispiel fur die Realisierung akfciven Lernens durch XOM besteht 
z. B. darin, dafi wahrend des Trainingsvorganges der topologieerhaltenden Abbil- 
dimg die Auswahl von Datenobjekten aus dem Erkundungsraum durch geeignete 
Berechnungsverfahren durch den aktuellen Status der topologieerhaltenden Abbil- 
dung beeinflufit wird, etwa durch die erreichte globale oder lokale Abbildungsqua- 
Utat, z. B. unter Verwendung von Verfahren oder Vorrichtungen gemafi Anspruch 
2. 

10. Molekulardynamiksimulation: Durch XOM konnen Verfahren und Vorrichtun- 
gen fur sog. "Molekulardynamiksimulationen" realisiert werden unter Riickgriff auf 
alle Punkte dieser Patentschrift, insbesondere auf Punkt 1 sowie in Kombination 
von XOM mit Verfahren und Vorrichtungen gemafi Stand der Technik. Hierun- 
ter versteht man Berechnungen der raum-zeitlichen Struktur von Molekulen ganz 
oder teilweise bekannter Zusammensetzung sowie die Verwertung der hieraus ge- 
wonnenen Erkenntnisse. Wichtige Beispiele sind die Analyse der Sekundax- oder 
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Tertiarstruktiir von Proteinen oder die Analyse der funktionellen raum-zeitlidien 
Stmktur aktiver Zentren von Enzymen. 

Eine wesentliche Erfindung in diesem Zusammenhang ist, dafi znm Zwecke der Mole- 
kulardynamiksimulation "starre", d. h. nnx dnrch starke aufiere Einfliisse wesentlich 
veranderliche, raumliche Beziehnngen oder Zwangsbedingungen zwischen den Ato- 
men eines Molekiils bzw. seiner Umgebung dazu verwendet werden, um die Topologie 
des Anordnungsraumes einer topologieerhaltenden Abbildung zu definieren. Ein typi- 
sches Beispiel fiir solche starren raumlichen Beziehungen sind Bindungslangen und 
Bindungswinkel in kovalenten Bindungen zwischen den Atomen eines Molekuls. Im 
einfachsten Fall wird jedem Atom bzw. einer Gruppe von Atomen ein Datenobjekt 
im Anordnungsraum sowie ein Godebuchobjekt zugeordnet. 

Durch Training der topologieerhaltenden Abbildung durch XOM konnen dann Wech- 
selwirkungen zwischen Atomen bzw. der Umgebung modelliert werden, wobei die 
Analyse des Ergebnisraumes die gewiinschte Stmktur des Molekiils liefert. Beispiele 
fiir Vorgehensweisen bei einer solchen Modellierung sind: 

(a) Modellierung der Wechselwirkung durch codebuchobjektspezijBsche Variation 
der Lernvorschrift der topologieerhaltenden Abbildung, etwa im Sinne von 
Punkt Im. Ein einfaches Beispiel w§xe bei Verwendimg selbstorganisierender 
Karten die von der Staxke der Wechselwirkung abhangende Modellierung des 
Lernparameters e gemafi Gleichung (9). Analog dazu ware eine Modellierung 
denkbar, bei der die Wechselwirkung zwischen zwei Atomen nicht bei jedem 
Lernschritt, sondern in Abhangigkeit von der Starke der Wechselwirkimg, sel- 
tener berucksichtigt wird. Hierdurch lassen sich auch unterschiedliche Grade 
von "Starrheit" im Hinblick auf die oben erwahnten raumlichen Zwangsbedin- 
gungen modellieren. 

(b) Iterative Anwendung von XOM, z. B. gemafi Is. Dies kann insbesondere mit 
einer Vorgehensweise kombiniert werden, in der die XOM-Molekulardynamiksi- 
mulation in kleine Simulationsstufen aufgegliedert wird, wobei in jeder Simula- 
tionsstufe nur geringe Anderungen der raum-zeitlichen Molekiilstruktur model- 
liert werden. Am Ende einer Simulationsstufe wird nun der Ergebnisraum als 
neuer Anordnungsraum der topologieerhaltenden AbbUdung verwendet und die 
Simulation fortgefuhrt. Hierbei konnen die urspriinglichen Zwangsbedingungen 
in der Topologie des Anordnungsraumes wieder korrigiert werden, die im Laufe 
des vorangegangenen Simulationsschrittes im Rahmen von Topologieverletzun- 
gen im Ergebnisraum im Vergleich zur Topologie des Anordntmgsraums nicht 
mehr adaquat reprasentiert waren. Topologieverletzungen im Hinblick auf die 
Zwangsbedingungen koimen also wieder korrigiert werden. Zugleich konnen 
neue topologische Beziehungen zwischen den Atomen, die aus dem Ergebnis 
des vorangegangenen Simulation^chrittes abgeleitet werden konnen, fiir die 
Modellierimg des neuen Anordnimgsraimies berucksichtigt werden. Insbeson- 
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dere sind auch Vorgehensweisen denkbar, bei denen eine standige Korrektiir 
von lokalen Topologieverletzungen, z. B. im Hinblick auf die unter 2 genannten 
Kriterien erfolgt. 

11. Robotik: In zn Punkt 10 analoger Weise lessen sich auch Problemlosungen in der 
Robotik erzielen, insbesondere anf dem Gebiet der inversen Kinematik. 

In Analogie zum Vorgehen bei der Molekulardynamiksimulation werden hierbei 
"starre", d. h. nur durch starke aufiere Einflflsse wesentlich verSLnderliche, rSumliche 
Beziehungen oder Zwangsbedingungen zwischen den Bestandteilen eines Roboters 
bzw. zwischen dem Roboter und seiner Umgebung dazu verwendet, um die Topologie 
des Anordnungsraumes einer topologieerhaltenden Abbildung zu definieren. Ein typi- 
sches Beispiel fiir solche starren raiunlichen Beziehungen sind Form und GroSe von 
Bauteilen eines Roboters oder Zwangsbedingungen bzgl. der relativen Beweglichkeit 
seiner Bauteile zueinander. Im einfachsten Fall wird charakteristischen Punkten von 
Bauteilen oder einer lokalisierten Gruppe von Bauteilen ein Datenobjekt im Anord- 
nungsraum sowie ein Codebuchobjekt zugeordnet. 

Alle in Punkt 10 gemaditen Bemerkungen sind dann in vollig analoger Weise an- 
wendbar. 

12. Sortieren: Durch XOM konnen Verfahren und Vorrichtungen fur das Sortieren yon 
Datenobjekten realisiert werden, -z. B. unter Riickgriff auf Punkt 1. Hierbei wird die 
gewiinschte Ordnung der Datenobjekte durch die Topologie des Anordnungsraumes 
reprasentiert. Dies ist auch insbesondere dann durchzufiihren, wenn als Eingabeda- 
ten lediglich eine echte Teilmenge der moglichen paarweisen Ordnungsbeziehungen 
zwischen den Datenobjekten bekannt oder berechenbar ist bzw. fiir das Sortieren 
verwendet werden soil. 

13. Optimierung: Durch XOM konnen Verfahren und Vorrichtungen zum AuflSnden 
von LQsungen von Optimierungsproblemen realisiert werden unter Riickgriff auf alle 
Punkte dieser Patentschrift, insbesondere auf Punkt 1 sowie in Kombination von 
XOM mit Verfahren und Vorrichtungen gemafi Stand der Technik. 

Wichtige Aspekte im Hinblick auf den Einsatz von XOM fur das AufRnden von 
Losungen von Optimierungsproblemen sind, dafi 

(a) dies insbesondere auch dann moglich ist, weim als Eingabedaten lediglich eine 
echte Teilmenge der berechenbaren paarweisen Distanzen zwischen den Date- 
nobjekten verwendet wird. 

(b) dies insbesondere auch dann moglich ist, wenn paarweise Distanzen zwischen 
Datenobjekten keine Metrik bilden. 

(c) dies insbesondere auch zum Aiiffinden von Losimgen von NP-harten Optimie- 
rungsproblemen eingesetzt werden kann, z. B. von metrischen oder insbeson- 
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dere auch nichtmetrischen TVavelling-Salesman-Problemen oder hierzu mathe- 
matisch aquivalenten Problemen. Beim Travelling-Salesman-Problem Vi^Tin bei- 
spielsweise die Position der Stadte die Topologie des Anordnungsraumes festle- 
gen, eine ringfonnige Gleichverteilung kann den Erkimdungsranin reprasentie- 
ren. Die Visualisierang der Losnng Vflrni dann sowohl durch einen Erloindungs- 
als auch insbesondere durch einen Anordnungsplot gemafi 2 erfolgen. 

14. Konstruktion von Hypermannigfaltigkeiten: Durch XOM konnen Verfahren 
und Vorrichtungen zxir Konstruktion approximierender Hypermannigfaltigkeiten und 
2ur nichtlinearen Hauptkomponentenanalyse realisiert werden unter RiickgrifF auf 
alle Punkte dieser Patentschrift, insbesondere auf Punkt 1 sowie in Kombination 
von XOM mit Verfahren und Vorrichtungen gemafi Stand der Technik. 

Widitige Aspekte im Hinblick auf den Einsatz von XOM zur Konstruktion approxi- 
mierender HypermgtnnigfaJtigkeiten imd zur nichtlinearen Hauptkomponentenana- 
lyse sind, daS 

(a) dies insbesondere dadurch erfolgen kaiin daB die Berechnung von Stiitzstellen 
fiir die Hypermannigfaltigkeiten durch lokale, ggf. gewichtete Mittelwertbil- 
dung, Interpolation oder Approximation im Anordnungsraum oder Ergebnis- 
raum nadi erfolgter XOM-Einbettung erfolgt, vgl. auch Punkt 4. Die XOM- 
Einbettxmg fur die nichtlineare Hauptkomponentenanalyse ist z. B. mSglidi 
durch die Berechnung eines Pfades durch die Datenobjekte des Anordnungs- 
raumes auf der Basis einer Einbettung in eine ID-Mannigfaltigkeit im Erkun- 
dungsraum. 

(b) hierbei insbesondere auch die Grofie oder Struktur der hierfttr gewaMten lo- 
kalen Bereiche veranderlich sein kann, z. B. imter Verwendtmg von Verfahren 
oder Vorrichtungen gemafi Punkt 2, z, B. mn eine lokale Anpassung der Re- 
prasentationsquaJitat der Hyperflache zu ermoglichen 

(c) insbesondere auch die Dimension oder Struktur des Tbrainingsdatensatzes im 
Erkundungsraum lokal oder global wahrend eines Trainingsvorganges oder im 
Laufe wiederholter Trainingsvorgange veranderlich sein kann, z. B. unter Ver- 
wendung von Kriterien zur Bestimmung der globalen oder lokalen Topologieer- 
haltimg Oder Dimensionsschatzung, z. B. gemafi Pimkten 2 oder 3, dynamisch 
axigepafit wird. 

(d) insbesondere die hypothetisch angenommene Dimension oder Struktur der re- 
prasentierenden Hypermannigfaltigkeit im Anordnimgsraum oder der Anord- 
nungsramn selbst lokal oder global wahrend eines Trainingsvorganges oder im 
Laufe wiederholter Trainingsvorgange veranderlich sein kann, z. B. unter Ver- 
wendung von Kriterien zur Bestimmung der globalen oder lokalen Topologieer- 
haltung oder Dimensionsschatzung , z. B. gemafi Punkten2 oder 3, dynamisch 
angepafit wird. 
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(e) insbesondere anch im Sinne evolutionaxer Algorithmen Strukturhjrpothesen 
iiber Datenverteilungen im Erkundungsrauin oder reprasentierende Hyperman- 
nigfaltigkeiteii im Anordnxmgsraum erzeugt, dynamisdi verandert und/oder 
optimiert werden, insbesondere durch Verfahren oder Vorrichtungen nadi 14c 
Oder 14d, wobei einzebie Strukturhypothesen auch als Individuen betrachtet 
werden koimen. Insbesondere konnen hierbei auch Mutationen durch Verwen- 
dung von Kriterien zur Bestinamung der globalen oder lokalen Topologieerhal- 
tung oder Dimensionsschatzung, z. B. nach Punkten 2 (hier insbesondere auch 
Punkt 2h) oder 3, beeinflufit werden. 

(f ) die Visualisierung der erzeugten HypermannigfaJtigkeiten direkt im Anordnim- 
graum oder indirekt iiber deren Einbettung im Erkundungs- bzw, Ergebnis- 
raum erfolgen kann. Die Visualisimmg ist somit durch Erkundungs-, Ergebnis-, 
und Anord nn n gsplots im Sinne von Punkt 2 moglich. Hierbei kann insbesonde- 
re auch die Visualisierung der lokalen Abbildungsqualitat gemafi Punkt 2 auf 
diesen Hypermannigfaltigkeiten oder deren Einbettungen durch Farbkodierung 
oder sonstige optische Kodierung erfolgen. 

15. Interpolation, Extrapolation, Approximation: Durch XOM konnen Verfah- 
ren und Vorrichtungen zur Interpolation, Extrapolation oder Approximation von 
Datenverteilungen realisiert werden unter Ruckgriff auf alle Punkte dieser Patent- 
schrift, insbesondere auf Punkt 1 sowie in Kombination von XOM mit Verfahren 
und Vorrichtungen gemafi Stand der Technik. 

Wichtige Aspekte im Hinblick auf Interpolation, Extrapolation oder Approximation 
bei XOM sind, dafi 

(a) dies insbesondere durch Verfahren und Vorrichtungen gemafi Punkt 11 erfolgen 
kann. 

(b) dies insbesondere auch dann m5glich ist, wenn die Interpolation, Extrapolation 
oder Approximation nach partiellem oder vollstandigem Training der topolo- 
gieerhaltenden Abbildung fur zusatzlich hinzugefiigte Datenobjekte erfolgen 
soil. 

(c) dies insbesondere durch Verfahren und Vorrichtungen gemS£ Punkt 14 erfolgen 
kann. 

(d) insbesondere durch Einsatz von Verfahren oder Vorrichtungen gemafi Stand der 
Technik, z. B. neuronaJe Netze, lokale Modelle oder beliebige andere Verfahren 
zur Interpolation, Extrapolation oder Approximation die Datenverteilungen im 
Erkundungs-, Ergebnis-, und/oder Anordnungsraima von im Sinne von XOM 
trainierten topologieerhaltenden Abbildungen verarbeitet werden konnen. 

16. Selbstorganisation: Durch XOM konnen Verfahren und Vorrichtungen zur Selbst- 
organisation und Morphogenese von beliebigen Objekten, Strukturen oder Syste- 
men, insbesondere technischen Systemen, realisiert werden, die uber Eigenschaften 
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wie Selbstregeneration, Selbstreproduktion oder dezentrale Informationsspeicheniiig 
verfiigen. Dies kann erfolgen unter Riickgriff auf alle Punkte dieser Patentschrift, 
insbesondere atif Punkt 1, hier besonders It sowie in Kombination von XOM mit 
Verfahren xrnd Vorrichtiingen gemSfi Stand der Technik. 

17. Relevance Learning: Durch XOM konnen Verfahren und Vorrichtungen zur Be- 
stimmung der Relevanz von Datenobjekten oder Komponenten von Datenobjekten 
fur Aufgaben der Datenverarbeitixng und Datenanalyse durch Bestinmiung aufga- 
benspezifischer Zielkriterien reaJisiert werden, unter Riickgriff auf alle Punkte dieser 
Patentschrift, insbesondere auf Punkt 1 sowie in Kombination von XOM mit Ver- 
faliren und Vorrichtungen gemafi Stand der Technik. Dies kann z. B. erfolgen durch 
SkaUenmg der einzehien Dimensionen bei vektoriellen Eingabedaten, Auswahl von 
bestimmten Datenobjekten aus dem TVainingsdatensatz fur das Training der topolo- 
gieerhaltenden AbbbUdimg, z. B. fur Aufgaben des xiberwachten Lemens, Clustering 
Oder der Konstruktion reprasentierender Hypermannigfaltigkeiten- 

18. Visualisierung imd Layout von Graphen: Durch XOM koimen Verfahren imd 
Vorrichtimgen zur Visualisierung imd zum Layout von Graphen realisiert werden 
unter Ruckgriff auf alle Punkte dieser Patentschrift, insbesondere auf Punkt 1 so- 
wie in Kombination von XOM mit Verfahren imd Vorrichtungen gemafi Stand der 
Technik. 

Der Einsatz von XOM zum Layout imd zur Visualisierung von Graphen kann auch 
insbesondere erfolgen, 

(a) wenn zum Training mehr als eine Datenverteilung im Erkundungsraum benutzt 
wird. 

(b) wenn zum TYaining keine uniforme DatenverteUimg im Erkundxmgsraum be- 
nutzt wird, 

(c) weim die Datenobjekte oder Teilmengen davon im Anordnungsraum nicht einer 
Metrik im mathematischen Sinne geniigen. 

(d) wenn die zum Training benutzten Datenverteilungen im Erkundungsraum nicht 
konvex sind. 

(e) wenn die Datenobjekte oder Teilmengen davon im Anordnungsraum oder im 
Erkundungsraum nicht der euklidischen Geometrie genugen oder deren Distanz 
durch beliebige Dissimilaritatsmafie definiert ist. 

(f ) weim fiir das IVaining Distanzen von beliebigen Datenobjekten verwendet wer- 
den, auch dann, wenn diese nicht durch eine Kante miteinander verbunden sind, 
z. B, unter Verwendung geodatischer Distanzen oder einer Rangmetrik. 

(g) wenn die topologieerhaltende Abbildung nicht der sequentiellen Formulierung 
einer selbstorganisierenden Karte nach Kohonen entspricht. 



48 




(h) wenn die zuin Training der topologieerhaltenden Abbildung verw^dete Ver- 
teilung der lirainingsdat^ im Brkundungsraum nicht die Dimension 2 oder 3 
hat. 

(i) wenn die zum Training der topologieerhaltenden Abbildung verwendete Ver- 
teilung keine Kugel in 3D ist. 

(j) wenn die TVainingvorschriffc der topologieerhaltenden Abbildung fur die 2ru 
den Knoten gehorenden Codebuchobjekte sich fiir unterschiedliche Knoten 
bzw. Codebuchobjekte unterscheiden kann, vgl. auch Punkt Im. 

(k) wenn fiir die Visualisierung des Graphen nicht alle Verbindungen gezeichnet 
werden, fiir die wechselseitige Distanzen bekannt sind oder beredmet wurden. 

19. Anwendungen: Durch XOM konnen Verfahren und Vorrichtungen fiir Anwen- 
diuigen aus den Bereichen Sdialtungsentwurf, Bioinformatik, Robotik, Meteorolo- 
gie, Bildverarbeitung, technische, selbstorganisierende und -reparierende Systeme, 
Textmining, Flugsicherung, Verkehrsleitsysteme, Godierung, Ghiffrierung, Sicher- 
heitstechnik konstniiert werden. Dies kann erfolgen unter Ruckgriff auf alle Pimkte 
dieser Patentschrift, insbesondere auf Punkt 1, hier besonders It sowie in KonoLbi- 
nation von XOM mit Verfahren und Vorrichtungen gemafi Stand der Technik. 

20. Kombinationen: Die in den einzelnen Punkten aufgefiihrten Verfahren und Vor- 
richtungen konnen auf vielSltige Weise kombiniert werden. Besonders hervorzuhe- 
ben sind in diesem Zusanimenhang: 

(a) Kombination von Dimensionsbestimmung und Einbettung 

(b) Kombination -von Einbettung und Bestimmung von approximierender Hyper- 
mannigfaltigkeiten 

(c) Kombination von Glustering und Glustervaliditatsanalyse 

(d) Kombination von Einbettung wad Glustering. Die Einbettimg kann hierbei zur 
Dimensions- bzw. Datenreduktion dienen. 

21. Kombination mit Vorrichtungen und Verfahren gemsLfi Stand der Tech- 
nik: Die in den einzelnen Punkten aufgefiihrten Verfahren und Vorrichtungen konnen 
auch in Kombination mit Verfahren und Vorrichtungen angewandt werden, die dem 
Stand der Technik entsprechen. Insbesondere sind hervorzuheben: 

(a) Kombination von XOM-Glustering mit Verfahren und Vorrichtungen zum iiber- 
wachten Lernen, insbesondere zur Erzeugung von Netzwerken im Sinne von 
Radiale-Basisfnnktionen-Netzwerken mit und ohne Normierung der Basisfunk- 
tionen. Hierbei kann zur Definition der Basisfunktionen ein beliebiges Distanz- 
maJ3 zwischen den Godebuchobjekten und den Lokaiisationsparametem (z. B. 
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Schwerpunkt, Median) der fiir das XOM-Clustering eingesetzten prototypi- 
schen Verteilungen des Erkundungsraum^ verwendet werden, z. B. die Li- 
kelihood der Positionierung der Codebuchobjekte im Hinblick auf die prototy- 
pischen Verteilungen. 

(b) Kombination von XOM-Einbettung mit Verfahren oder VorrichtTuigen zur In- 
terpolation Oder Approximation. 

22. Visualisierung: Zur Visualisierung von Eingabedaten, Stnikturhypothesen und 
Beredinungsergebnissen bei XOM konnen zahlreiche Verfahren und Vorrichtungen 
eingesetzt werden. Hervorzuheben sind hier insbesondere 

(a) die Visualisierung der Codebuchobjekte im Ergebnis- bzw. Erkundungsramn 
Oder deren Wandenmgsbewegung im Siime eines Ergebnisplots, vgl. Punkt 2 

(b) die Visualisierung der IVainmgsdatenverteilungen im Erkundimgsraum im Sin- 
ne eines Erkundungsplots, vgl. Punkt 2 

(c) die Visualisierung der Datenobjekte des Erkundungs- oder Ergebnisraumes im 
Anordnungsramn im Sinne eines Anordnimgsplots, vgl. Punkt 2 

(d) die Visualisierung der Abbildungsqualitat durch Distanzplot oder daraus ab- 
geleitete Grofien, vgL Punkt 2 

(e) Farbcodierung oder anderw:eitige graphische Kennzeichnung der lokalen Topo- 
logieverletzung oder anderer lokaler Kriterien der Abbildungsqualitat gemSfi 
Pxmkt 2 im Erkundungs-, Ergebnis-, Anordnxmgs-, oder Distanzplot. 

23. Mutual Connectivity Analysis: Im folgenden seien Verfahren und Vorrichtun- 
gen beschrieben, die eine innovative Art der Datenverarbeitung auf der Basis von 
Dissimilaritatsdaten ermoglichen. Das zugrundehegende Verfahren wird forthin als 
"Mutual Connectivity Analysis" (MCA) bezeichnet. XOM reprasentiert eine wich- 
tige Methode zur Datenanalyse hn Zusammenhang mit MCA, siehe unten. 

Zur Verdeutlichung sei zunachst ein Beispiel fur einen typischen technischen Ver- 
fahrensablauf dargestellt. Bs sei betont, dafi dieser Verfahrensablauf nicht auf die 
in diesem Beispiel genannten Datentypen und Beredmungsverfahren eingesdirankt 
ist. 

• Ausgangspunkt sei eine Menge von N Zeitreihen Z = {zi, . . . , zn}, z. B. in 
Form einer Menge von Datenvektoren im R^, M G IN, wobei jeder Datenvek- 
tor z„, n = 1, . . . , iV eine Zeitreihe und jedes Element Znt des Vektors den 
Wert der Zeitreihe zum Zeitpunkt t reprasentiert mit t G {1, . . . , M}. 

• Nun wird far jede Zeitreihe ein "gleitendes Fenster" der Lange 2p -h 1 mit 
p, p 6 IN, p < Af definiert, das 2p+ 1 zeitlich benachbarte Werte der Zeitreihe 
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mitt—p < * < t +p, bzw. 2p+ 1 aiifeinanderfolgende Elemente des die Zeitrei- 
he reprasentierenden Datenvektors zusammenfatfit, wobei p fur alle Zeitreihen 
gleich gewaMt wird. (Fiir den Anfang und das Ende der Zeitreihe seien heu- 
ristische Konventionen getroffen, wie das gleitende Fenster dort zu definieren 
sei.) Die hierdnrch axis der Zeitreihe ausgesdmittenen Bereidtie bzw. die aus 
dem die Zeitreihe reprasentierenden Datenvektor ausgeschnittenen Vektoren 
seien im folgenden als "Fenster" x„(4) bezeichnet. 

• Nun werden jeweils zwei Zeitreihen und ausgewahlt. 

• Dann wird fur alle Fenster dieser beiden Zeitreihen, beispielsweise durch An- 
wendung eines iiberwachten Lemverfahrens, eine Distanz d(xr(t),Xs(t)) ermit- 
telt. Dies kann beispielsweise erfolgen, indem fur jedes t der Vorhersagefehler 
ennittelt wird, mit dem nach AbschluS des TVainings des iiberwachten Lem- 
verfahrens y:s{t) aus Xr(t) vorhergesagt werden kann. Das liberwachte Lern- 
verfahren kann beispielsweise trainiert werden nut einer Teilmenge aller Paare 
(xv(t),X5(t)), hierzu kann die Menge di^er Paare - wie fiir die Anwendung 
iiberwachter Lemverfahren allgemein liblich - in Trainings-, Test-, und/oder 
Validierungsdatensatze aufgespalten werden. Es ist klar, dafi es je nach Prage- 
stellung auch sinnvoll sein kann, statt d(xr(t),X5(t)) auch d(xr(t),X5(t + r)) 
nut geeignet zu wahlendem Zeitversatz r zu b^immen. 

• Durch ein geeignetes Berechnimgsverfahren bestimmt man nun fur die als Test- 
datensatz ausgewahlten Paare (X|.(i),X5(t)) aus den errechneten d(Xr(t),X5(i)) 
eine Distanz Drs = D(xr,Xa) zwischen den Zeitreihen und z^. Eine nahe- 
liegendes Berechnungsverfahren hierfur ist zum Beispiel die Mittelwertbildung 
aus den d{x^{t)^'x,s{t)) fiir alle im Testdatensatz betrachteten t im Sinne eines 
mittleren Vorhersagefehlers. Man beachte, dafi i. a. Drs ¥^ Dsr gilt. 

• Das Verfahren kann nun beispielsweise for alle Paare von Zeitreihen wie- 
derholt werden. 

• Die hieraus erhaltene Distanzmatrbc der Distanzen zwischen jeweils zwei Zeitrei- 
hen kann mm auf beliebige Weise weiterverarbeitet werden, insbesondere durch 
Verfahren der Datenpartitionierung auf DissimilaritStsdaten, z. B. paarweises 
Clustering gemaB Stand der Technik, z, B. [21], [14], [10] oder dieser Patent- 
schrift, z. B. nach Punkt 5 oder diurch Verfgihren der Klassifikation auf Dissi- 
milaritatsdaten, z. B. gemafi Punkt 7d. 

Bei der Bestinmnmg der wechselseitigen Distanzen der Zeitreihen kann ein erheb- 
licher Geschwindigkeitsvorteil dadurch erzielt werden, dafi Berechnungsvorschriften 
angewandt werden, die diese Distanzbestimmung in zwei Schritte aufepalten, wo- 
bei ein Schritt fiir jede Zeitreihe nur einmal diurchgefuhrt und nur der verbleibende 
Schritt fiir jedes Zeitreihenpaar durchgefuhrt werden mufi. 

Dies sei an obigem Beispiel erlautert: So Icxnn man die Vorhersage einer Zeitrei- 
he Zs aus einer anderen Zeitreihe beispielsweise durch Training eines Radiale- 
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Basisfunktionen-Netzwerkes (z. B, nach [46]) verwirklichen: hierbei werden zunaxdist 
die Fenster der Zeitreihe einer Vektorquantisienmg unterzogen. Hierdurch erhalt 
man prototypische Zeitreihenfenster, die man im Sinne der einfuhrenden Bemer- 
kungen fiber Vektorquantisierung in Absdmitt 1.1 als Codebuchvektoren bezeich- 
nen kann. Entscheidend ist, dafi diese Vektorquantisienmg fiir jede Zeitreihe nur 
einmal durchgefuhrt werden mufi. Die Codebuchvektoren werden nun far das uber- 
wachte Training der Ausgabeschicht ein^ Radiale-Basisfuiiktionen-Netzwerks ein- 
gesetzt (vgl. z. B. [46]), wobei als Zielwerte fur das uberwachte Training die Fenster 
der Zeitreihe z^ eingesetzt werden. Das TVaining der Ausgabeschicht des Radiale- 
Basisfunktionen-Netzwerkes mufi fiir jede aus der Zeitreihe vorherzusagende Zeit- 
reihe Zs wiederholt werden, also - falls man alle Zeitreihenpaare beriicksichtigt - ins- 
gesamt iV^-mal. Die Vektorquantisierung mufi also - falls man alle Zeitreihenpaare 
beriicksichtigt - insgesamt JV-mal, das Training der Ausgabeschicht des Radiale- 
Basisfunktionen-Netzwerkes JNT^-mal durchgefuhrt werden. Im allgemeinen ist nun 
der Beredmungsaufwand fiir die Vektorquantisienmg erheblich grofier als fur das 
uberwachte Training der Ausgabeschicht des Radiale-Basisfunktionen-Netzwerkes, 
wodurch sich fur das Gesamtverfahren ein erheblicher Geschwindigkeitsvorteil er- 
gibt. 

In analoger Weise kann man statt der Anwendung von Radiale-Basisfunktionen- 
Netzwerken auch lokale Modelle einsetzen, z. B. [43], [29], z. B. lokale Durch- 
schnittsmodelle oder lokale lineare Modelle. So kann man fur die Vorhersage ei- 
ner Zeitreihe z^ aus einer anderen Zeitreihe z^ folgendermafien vorgehen: Bestimme 
zunachst jeweils die k nachsten Nachbarn der Fenster der Zeitreihe z^ unter den an- 
deren Fenstern dieser Zeitreihe. Dieser Schritt mufi fur jede Zeitreihe nur einmal 
durchgefuhrt werden. In einem zweiten Schritt wird dann fur jede vorherzusagende 
Zeitreihe gemafi der Berechnungsvorschrift des jeweils angewandten lokalen Modells 
zwischen diesen k nachsten Nachbam der Zeitreihenfenster interpoliert bzw. appro- 
ximiert, wobei als Zielwerte fur das uberwachte Training die Fenster der Zeitreihe z^ 
. eingesetzt werden. Die Interpolation bzw. Approximation fur die k nachsten Nach- 
barn der Zeitreihenfenster in der Berechnungsvorschift des lokalen Modells mufi fiir 
jede aus der Zeitreihe vorherzusagende Zeitreihe Zg wiederholt werden, also - 
falls man alle Zeitreihenpaare beriicksichtigt ~ insgesamt iV^-mal. Die Suche der k 
nachsten Nachbarn der Zeitreihenfenster mufi also - falls man alle Zeitreihenpaa- 
re beriicksichtigt - insgesamt iV-mal, die Interpolation bzw. Approximation ftir die 
gefundenen A; nachsten Nachbarn der Zeitreihenfenster JV^-mal durchgefuhrt wer- 
den. Im allgemeinen ist nun der Berechnungsaufwand fur die Suche der A; nax^hsten 
Nachbam der Zeitreihenfenster erhebUch grofier als fiir die Interpolation bzw. Ap- 
proximation gemafi der Berechnungsvorschrift des lokalen Modells, wodurch sich fiir 
das Gesamtverfahren ebenfalls ein erheblicher Geschwindigkeitsvorteil ergibt. 

Zur Verdeutlichung sei zunaLchst ein Beispiel fiir einen typischen technischen Ver- 
fahrensablauf dargestellt. 
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Es sei betont, dafi das Konzept der MCA nicht auf die in diesem Beispiel zux Ana- 
lyse von Zeitreihenmengen genannten Datentypen und Berechnungsverfahren einge- 
schrankt ist. Das obige Beispiel motiviert allgemein vielmehr folgenden technischen 
Verfalirensablauf: 

Zunachst seien einige Begriffe definiert: 

Datenobjekte seien Daten ohne jegliche Beschrankungen, z. B. Mengen, Zahlen, Vek- 
toren, Graphen, Symbole, Texte, Bilder, Signale, mathematische Abbildnngen und 
deren Reprasentationen, z. B. Matrizen, Tensoren etc. sowie beliebige Kombinatio- 
nen von Datenobjekten. 

Unterdatenobjekbe seien Datenobjekte, die nicht die Gesamtinformation des Date- 
nobjektes enthalten, d. h. aus der Kenntnis eines Unterdatenobjektes sei das ur- 
sprungliche Datenobjekt i. a. nicht voUstandig berechenbar. 

Distanzobjekte seien Datenobjekte, die Ahnlichkeitsbeziehungen bzw. Distanzen zwi- 
schen Datenobjekten gemaS einem beliebigen Distanzmafi charakterisieren. Hierbei 
sind sowohl dnrch Metriken induzierte Distanzmafie als auch insbesondere durch 
beliebige, ggf. nicht durch eine Metrik bestimmte, Distanzmafie definierte Ahnlich- 
keitsbeziehungen bzw. Dissimilarit&ten eingeschlossen. Einige tjrpische Distanzmafie 
auf der Basis von Dissimilaritaten sind z. B. in [19] aufgefiihrt. Metrik sei hierbei in 
mathematischem Sinne definiert, siehe z. B. [5]. 

Unterdistanzobjekte Distanzobjekte zwischen Unterdatenobjekten, insbesondere un- 
terschiedlicher Datenobjekte. 

Z\ir Verdeutlidiung sei erwahnt, daB im Hinblick auf das obige Beispiel folgende 
Entsprechungen gewahlt werden konnten: Datenobjekt entspricht Zeitreihe. Un- 
terdatenobjekt entspricht Fenster. Unterdistanzobjekt entspricht Distanz zwischen 
Zritreihenfenstem imterschiedlicher Zeitreihen. 

Technischer Verfahxensablauf, MCA: 

Gegeben sei eine Menge von Datenobjekten. Die Menge der Datenobjekte kann 
insbesondere auch exakte Kopien von Datenobjekten enthalten. 

• Gib die Menge der Datenobjekte in das Verfahren bzw. die Vorrichtung zur 
Datenverarbeitung ein. 

• Zerlege die Datenobjekte in Unterdatenobjekte. Die Teilung mu6 weder dis- 
junkt noch vollstandig erfolgen. 

• Berechne Distanzobjekte zwischen Unterdatenobjekten der eingegebenen Men- 
ge von Datenobjekten. Diese Distanzobjekte seien Unterdistanzobjekte ge- 
nannt. 

• Berechne unter Verwendung der Unterdistanzobjekte neue Distanzobjekte, die 
die Distanzen zwischen den Datenobjekten der eingegebenen Menge von Da- 
tenobjekten charakterisieren. 
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• Gib die hierdurch erredmeten Distanzobjekte axis. 

Wesentlich ist, daB die Berechnung der Distanzobjekte zwischen den Unterdaten- 
objekten bzw. Datenobjekten dnrch beUebige Verfahren zur Interpolation, Extra- 
polation, und/oder Approximation durchgefuhrt werdm kann. Insbesondere fallen 
hieninter: 

(i) Statistische Lernverfahren jeglicher Art, insbesondere solche, die uber- 
wachtes Lemen voraussetzen, insbesondere neuronale Netze und Support Vec- 
tor Machines, Bayes-Netze, ffidden-Markov-Modelle, Observable Operator Mo- 
dels (z. B. [23]). Unter den neuronalen Netzen seien insbesondere erwahnt: 
Multilayer-Perceptron in alien in der Literatur beschriebenen Varianten, insbe- 
sondere mit Training durch Error-Backpropagation; Radiale-Basisfunktionen- 
Netzwerke in alien in der Literatur beschriebenen Varianten, insbesondere auch 
generalisierte Radiale-Basisfanktionen-Netzwerke, ART-Netzwerke, Local Li- 
near Mappings (LLM) (vgL z. B. [36]) in alien in der Literatur beschriebenen 
Varianten sowie andere neuronale Netze, die iiberwachtes Lemen ermoglichen, 
z. B. topologieerhaltende Abbildungen, z. B. selbstorganisierende Kaxten, sowie 
XOM, 

(ii) Lokale Modelle jeglicher Art: Lokale Durchschnittsmodelle (auch mit Ge- 
wichtung), lokale lineare Modelle, lokale Modelle mit topologischen Zusatzbe- 
dingungen ( z. B. [43]), insbesondere adaptive lokale Modelle, deren Parameter 
vom jeweils erzielten Lernerfolg abhangen (zur Literaturiibersicht vgl. z. B. audi 
[43], [30], [29]). 

(iii) Verfahren der schliefienden Statistik, insbesondere wenn Priifgrofien oder 
Signifikanzniveaus statistischer Tests als Distanzmafi benutzt werden [39]. 

(iv) Spezielle Berechnungsverfahren wie Levenstein-Distanz, Mutual Informa- 
tion, Kullback-Leibler-Divergenz, in der Signalverarbeitung, insbesondere fur 
Biosignale, eingesetzte KoharenzmaBe, z. B. [42], [41], LPC cepstral distaace, 
Distanzmafie, die Leistungsspektren zweier Signale in Beziehung setzen, wie 
z. B. die Itakura-Saito-Distanz (vgl. [22]), die Mahalanobis-Distanz, Distanz- 
mafie im Hinblick auf die Phasensynchronisation von Oszillatoren, z. B. [37]. 

Eine Variante des Verfahrensablaufe sei besonders aufgefuhrt: Zur Verdeutlichung 
sei erwahnt, dafi im Hinblick auf das obige Beispiel zur Analyse einer Menge yon 
Zeitreihen zusatzlich folgende Entsprechungen gewahlt werden konnten: Ein Hilfs- 
datenobjekt entspricht beispielsweise einem Codebuchvektor bei der Vektorquan- 
tisierung der Zeitreihenfenster einer Zeitreihe bei der Zeitreihenvorhersage durch 
Radiale-Basisfunktionen-Netzwerke. Ein Hilfsdatenobjekt entspricht alternativ bei- 
spielsweise einer Menge von k nachsten Nachbarn eines Zeitreihenfensters bei der 
Zeitreihenvorhersage durch lokale Modelle. 
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Variaate des technischen VerfaJirensablaufes, MCA: 

Gegeben sei dne Menge von Datenobjekten. Die Menge der Datenobjekte kann 
insbesondere auch exakte Kopien von Datenobjekten enthalten. 

• Gib die Menge der Datenobjekte in das Verfahren bzw. die Vorrichtung zur 
Datenverarbeitung ein. 

• Zerlege die Datenobjekte in Unterdatenobjekte. Die Teilung mufi weder dis- 
junkt noch voUstandig erfolgen. 

• Beredine fiir Unterdatenobjekte einzelner Datenobjekte neue Datenobjekte, 
sog- Hilfsdatenobjekte- 

• Berechne unter Verwendung von Hilfsdatenobjekten Distanzobjekte zwischen 
Unterdatenobjekten der eingegebenen Menge von Datenobjekten. Diese Di- 
stanzobjekte seien Unterdistanzobjekte genannt. 

• Berechne unter Verwendung von Unterdistanzobjekten neue Distanzobjekte, 
die die Distanzen zwischen den Datenobjekten der eingegebenen Menge von 
Datenobjekten charakterisieren. 

• Gib die hierdurch errechneten Distanzobjekte aus. 

Insbesondere konnen bei der Berechnung eines Hilfsdatenobjekts nur die Unterdar 
tenobjekte jeweils ^es einzelnen eingegebenen Datenobjekts und/oder mehr als 
jeweils ein Unterdatenobjekt verwendet werden. 

Im Anschlufi konnen die ausgegebenen Distanzobjekte analysiert werden. Hierzu 
eignen sich Verfahren und Vorrichtungen gemafi Stand der Technik und/oder den 
Ausfuhrungen in dieser Patentschrift. Insbesondere seien in diesem Zusammenhang 
speziell erwahnt: Verfahren und Vorrichtungen zum Clustering und/oder zum iiber- 
wachten Lemen, insbesondere zum paarweisen Clustering von Dissindlaritatsdaten, 
z. B. [21], [14], [10], Verfahren und Vorrichtungen zum XOM-Clustering gemaB 
Punkt 5, sowie zum iiberwachten Lemen, z. B. zur Klassifikation, auf Dissimila- 
ritatsdaten z. B. [15], Verfahren und Vorrichtimgen zum iiberwachten Lemen auf 
Dissimilaritatsdaten durch XOM gemaB Punkt 7d. 

Als Anwendimgsbeispiele seien genannt: Datenverarbeitung, z. B. Clustering, von 
Finanzzeitreihen, z. B. Wertpapierkursen, Verarbeitung von Daten, z. B. Zeitrei- 
hen, aus den Bereichen Wirtschaft, Finanzen, Medizin, Naturwissenschaffc und/oder 
Technik, insbesondere angeordnete Datenobjekte, z. B. Zeitreihen, aus Laborwerten 
Oder sonstigen Mefiwerten biomedizinischer oder meteorologischer Untersuchungs- 
verfahren, z. B. biomedizinische Bilder, Genexpressionsprofile, Gen- oder Amino- 
sauresequenzen. 

Fiir obiges Beispiel zur Zeitreihenanalyse ist klar, dafi die dort getroffenen Festle- 
gungen von Datentypen imd Berechnungsverfahren im Lichte der allgemeinen tech- 
nischen Verfahrensablaufe keine Binschrankungen bedeuten. Insbesondere konnen 
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statt Zeitreihen bdiebige, z. B. angeordnete Datenobjekte, z. B. BUder oder Gense- 
quenzen, verwendet werden. Bei der Analyse von Zeitreihen miissen die Werte der 
Zeitreihen nicht zeitlich aquidistant ermittelt worden sein, es miissen kerne gleiten- 
den Fenster oder uberwachte Lemver£ahren zur Analyse der ausgegebenen Daten 
verwendet werden etc. 
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Patentanspriiche 

1. Verfahren zur Datenverarbeitung, das auf einer Datenverarbeitungseinrichtung ab- 
lauft, fur die Abbildung von zu verarbeitenden Eingabedaten auf Ausgabedaten, bei 
dem: 

zu verarbeitende Datenobjekte als Eingabedaten eingegeben werden, 

die eingegebenen Datenobjekte mit Hilfe einer topologieerhaltenden Abbildung 
verarbeitet werden, indem 

Neuronen nach einem vorgegebenen Schema im Anordnungsraum angeord- 
net werden, 

den Neuronen Codebuchobjekte im Ergebnisraum zugeordnet werden, 
Codebuchobjekte verarbeitet werden gema£ der Berechnungsvorschriffc ei- 
ner topologieerhaltenden Abbildung unter Verwendung von Datenobjekten 
des Erkundungsraumes, 

die verarbeiteten Codebuchobjekte als Ausgabedaten ausgegeben werden, 

dadurch gekennzeichnet, dafi 

zumindest ein Teil der eingegebenen Datenobjekte verwendet wird, um die 
Anordnimg von Neuronen im Anordnungsraum festzulegen, imd/oder 

dafi fiir die Datenverarbeitung erforderliche, von den zu verarbeitenden Eingar- 
bedaten unabhangige Datenobjekte eingegeben werden, die als Datenobjekte 
des Erkundungsraumes verwendet werden. 

2. Verfahren nach Anspruch 1, bei dem die zu verarbeitenden Datenobjekte Distanz- 
objekte sind. 

3. Verfahren nach Anspruch 1 oder 2, bei dem Datenobjekte im Anordnungsraum 
irregular angeordnet werden. 

4. Verfahren nach einem der vorhergehenden Anspriiche, bei dem Datenobjekte des 
Anordnungsraumes, Erkundungsraumes und/oder Ergebnisraumes 

einer nichteuklidischen Geometric geniigen, 

benutzt werden, die Distanzobjekte zu Datenobjekten einer Ibkalen Nachbar- 
schaft von Datenobjekten sind, 

Datenverteilungen mit fraktaler Dimension bilden, 

Datenverteilungen nicht orientierbarer Flachen im Sinne der Differentialgeo- 
metrie reprHsentieren, 
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wahrend des Ttainingsvorganges oder im Laufe rnelirerer Trainingsvorgange 
der topologieerhaltenden AbbUdung hinzugefugt, weggelassen oder verandert 
werden, insbesondere Distanzobjekte im Anordnungsraum hinzugefugt, wegge- 
lassen oder verandert werden, 

durch Zusatzbedingungen beeinfiufit werden, 

in lokalen Einheiten gespeichert und/oder verarbeitet werden 

und/oder 

nach Abschlufi des Trainings der topologieerhaltenden Abbildung hinzugefugt, 
weggelassen oder verandert werden. 

5. Verfahren nach einem der vorhergehenden Anspriiche, bei dem die Berechnungs- 
vorschriffc der topologieerhaltenden Abbildung und/oder wenigstens ein Parameter 
dieser Beredmungsvorsdirift 

in Abhangigkeit vom jeweils verarbeiteten Datenobjekt des Anordnungs-, Er- 
kundimgs- und/oder Ergebnisraumes ausgewahlt wird, 

wahrend des Trainmgsvorganges oder im Laufe mehrerer Trainingsvorgange 
der topologieerhaltenden Abbildung verandert wird, insbesondere in Abhangig- 
keit vom jeweils verarbeiteten Datenobjekt des Anordnungs-, Erktmdungs-, 
und/oder Ergebnisraumes, 

imd/oder 

durch Zusatzbedingungen beeinflufit wird. 

6. Verfahren zur Datenverarbeitung, das auf einer Datenverarbeitungseinrichtung ab- 
lauft, fiir die Abbildung von zu verarbeitenden Datenobjekten auf Distanzobjekte, 
bei dem: 

zu verarbeitende Datenobjekte eingegeben werden, 

Distanzen zwischen den zu verarbeitenden Datenobjekten als Distanzobjekte 
berechnet werden, 

diese Distanzobjekte als Ausgabedaten ausgegeben werden, 

dadurch gekennzeichnet, da6 

die Distanzen durch statistische Lemverfahren, lokale Modelle, Verfahren der 
schliefienden Statistik, und/oder durch eines der folgenden speziellen Berech- 
nimgsverfahren berechnet werden: 

Levenstein-MaB, 
Mutual Information, 
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KxiUbaxdc-Leibler-Divergenz, 

in der Signalverarbeitimg, insbesondere fur Biosignale, eingesetzte Koha- 
renzmaBe, 

LPC cepstral distance, 

Beredinungsverfahren, die Leistungsspektren zweier Signale in Beziehung 
setzen, wie z. B. die Itakura-SaitoDistanz, 
die MaJialanobis-Distanz 
und/oder 

Beredmungsverfaliren im Hinblick auf die Phasensynchronisation von Os- 
zillatoren. 

7. Verfahren zur Datenverarbeitung, das auf einer Datenverarbeitungseinrichtung ab- 
lanft, fiir die Bestimmung der Clustervaliditat, 

bei dem Datenobjekte eingegeben werden, 

Distanzobjekte zwischen diesen Datenobjekten eingegeben iind/oder beredmet 
werden, 

sowie eine Zuordnxmg der zu verarbeitenden Datenobjekte zu Gruppen ein- 
gegeben und/oder berechnet wird, insbesondere gemafi einem Verfahren nach 
einem der Anspruche 1 bis 5, 

und ein MaS fiir die Qualitat dieser Zuordnung als Ausgabedaten ausgegeben 
wird, 

dadurch gekennzeichnet, dafi 

das Mafi fur die Qualitat der Zuordnung unter Verwendung von wenigstens 
einem Teil der eingegebenen und/oder berechneten Distanzobjekte berechnet 
wird. 

8. Verfahren nach Anspruch 7, bei dem das Mafi fiir die Qualitat der Zuordnung imter 
Anwendung eines Verfahrens nach einem der Anspruche 1 bis 6 und/oder einer 
Kostenfiinktion eines Verfairens zum Clustering von Dissimilaritatsdaten berechnet 
wird. 

9. Verfahren nach einem der vorhergehenden Anspruche, das wiederholt durchgefuhrt 
wird, wobei Ausgabedaten einer vorhergehenden Durchfiihrung des Verfahrens als 
Eingabedaten einer nachfolgenden Durchfiihrung des Verfahrens eingegeben werden. 

10. Verfahren nach einem der vorhergehenden Anspruche, bei dem die Qualitat der 
Ausgabedaten bestimmt wird und die bestimmte Qualitat ausgegeben wird. 

11. Verfahren nach Anspruch 10, bei dem die Qualitat bestimmt wird, indem 
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Mafie zur Topologie- und/oder Verteilungserhaltung beredmet werden, 
Verzerrungsmafie beredmet werden, 

die Distanzen von Datenobjekten im Anordnungsraum mit Distanzen von kor- 
respondierenden Datenobjekten im Ergebnis- und/oder Erkundungsraum in 
Beziehung gesetzt werden, insbesondere in einem Distaozplot au%etragen wer- 

Datenobjekte des Erkundungs-, Ergebnis-, und/oder Anordnungsraumes gra. 
phisdi dargesteUt werden, insbesondere in einem Erkundungs-, Ergebnis- und/ 
Oder Anordnungsplot aufgetragen werden, 

aus Dataiobjekten des Erkundungs-, Ergebnis-, und/oder Anordnungsraumes 
berechnete Datenobjekte graphisdi dargestellt werden, insbesondere in einem 
Erkundungs-, Ergebnis-, und/oder Anordnungsplot aufgetragen werden, 
der Abbildungsfehler zur Interpolation, Extrapolation, Approximation und/ 
Oder uberwachtes Lemen beredmet und ausgegeben wird, insbesondere durch 
tun- und Rudqprojektion, 

imd/oder 

Datenobjekte sequentiell verarbeitet werden. 

12. ^^ail^en nadi Ansprudi 10 oder 11. bei dem die bestbnmte QuaUtat benutzt wird, 

wlS*^*^/^A??^J'*^'^^ Ergebnis-. und/oder Anordnungsraumes der topo- 
logieerhaltenden Abbildung hinzuzufugen, wegzulassen oder zu verandem. 
und/oder 

die Beredmungsvorsdirift der topologieerhaltenden Abbildung und/oder deren Pa- 
rameter zu verandem, insbesondere in Abhangigkeit von Datenobj^ten des Erkun- 
dungs-, Ergebnis-, und/oder Anordnungsraumes. 

13. Verfahren na<^ dnem der vorhergehenden Anspriidie, bd dem die Datenverarbd- 
tung angewandt wird 

zur Dimensionsbestimmung, insbesondere zur Bestimmung fraktaler Dimensio- 
nen, 

zur mchtlinearen Einbettung, insbesondere von niditmetrisdien Daten und/oder 
JDissimuantatsdaten, ' 

zum Clustering, insbesondere von niditmetrisdien Daten und/oder Dissimila- 
ritatsdaten, ' 

zur Bertimmung der ClustervaUditat, insbesondere fflr DissimilaritStsdaten 
und/oder niditmetrisdie Daten, 
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zum uberwachten Lemen, insbesondere auf nichtmetrisdien Daten und/oder 
Dissimilantatsdaten, 

zur Registrierung von Datensatzen, 

zum aktiven Lemen, 

zum Sortieren, 

zur Optimierung, insbesondere fur nichtmetrische Daten und/oder DissimUa- 
ntatsdaten, 

zum Auffinden von Losungen von TVavelling-Salesman-Problemen und daau 
^uivalenten Problemen, insbesondere nichtmetrisdien liravelling-Salesmaii- 
froblemen, 

zur Beredmung von Hypermannigfaltigkeiten, 

zur Interpolation, Extrapolation, und/oder Approximation, 

zum Relevance Learning, 

zur Visualisierung von Graphen, 

zum Layout von Graphen 

und/oder 

zur Konstrulction sich selbst entwidcelnder, sidi selbst reparierender und/oder 
reproduzierender Systeme, insbesondere technischer Systeme. 

14. Verfahren nadi Ansprudi 13, das wie folgt kombiniert angewandt wird: 

Dimensionsbestimmung und nichtUneare Einbettung, 

niditlineaxe Einbettung und Beredmung von Hypermannigfaltigkeiten, 

Clustering imd Bestimmung der ClustervaJiditat 

und/oder 

nichtlineare Einbettung und Clustering. 

15. Verfehren naA einem der vorhergehenden Anspriidie, bei dem die Datenverarbei- 
tung angewandt wird 

zur Moldculardynamiksimulation, insbesondere bei dem Zwangsbedingungen 
msbesondere starre raumUdie Beziehungen, im Molekfil und/oder seiner Um- 
gebung als Distanzen der Neuronen im Anordnungsraum modelUert werden, 
zur Probleml6sung in der Rx)botik, insbesondere bei dem ZwangsbedingungJn 
msbesondere starre raumlidie Beziehungen, im Roboter und/oder seiner Um- 
gebung als Distanzen der Neuronen im Anordnungsraum modelliert werden, 
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und/oder 

auf Daten aus den Bereichen Wirtschaft, Finanzen, Medizin, Geisteswissen- 
schaften, Naturwissenschaften und/oder Technilc, insbesondere 

aus den Berdchen Schaltungsentwurf, Bioinformatik, Robotik, Meteorolo- 
gie, Bildverarbeitung, 

aus dem Bereich Datamining, insbesondere Itextmining, 
si^SS^^^*^ Sicherheitstechnik, insbesondere Plug- und/oder Zugangs- 

aus dem Bereich Logistik, insbesondere Verkehisleitsysteme, 
und/odar 

aus dem Bereich der Nachrichtentedmik und/oder Kryptologie. 

16. Datenveraxbeitungseinrichtung zur Durchfuhnmg eines Verfahrens nach einem der 
vorhergehenden Anspriiche. uer 

17. Computerprogrammprodukt, welches in einem Speichermedium gespeichert ist und 
welches Softwaxecodeabschnitte umfafit, mit denen Sdmtte nach einem der vorher- 
gehenden Verfehr^asanspriiche ausgefuhrt werden, wenn das Computerprogramm- 
produkt auf einer DatenverarbeitungBeiniichtung iSuft 
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Zusammenfassung 

Die Erfindung betrifffc ein Verfahren zur Datenverarbeitung, das auf einer Datenver- 
arbeitungseinrichtung ablauft, fiir die AbbUdimg von zu verarbeitenden Eingabeda. 
ten auf Ausgabedaten, bei dem: zu verarbeitende Datenobjekte als Eingabedaten 
eingegeben werden, die eingegebenen Datenobjekte mit Hilfe einer topologieerhal- 
tenden Abbildung veraxbeitet werden, indem Neuronen nach einem vorgegebenen 
Schfflna im Anordnungsraum angeordnet werden, den Neuronen Codebuchobjekte 
un Ergebnisraum zugeordnet werden, Codebuchobjekte verarbeitet werden gemafi 
der Beredmungsvorschrift einer topologieerhaltenden Abbildung unter Verwendung 
von Datenobjekten des Erkundungsraumes, die verarbeiteten Codebuchobjekte als 
Ausgabedaten ausgegeben werden, dadurch gekennzeichnet, dafi zumindest ein Teil 
der eingegebenen Datenobjekte verwendet wird, um die Anordnung von Neuronen 
un Anordnungsraum festzulegen, und/oder dafi fiir die Datenverarbeitung erfor- 
derkche, von den zu verarbeitenden Eingabedaten unabhSngige Datenobjekte ein- 
^geb^ werden, die als Datenobjekte des Erkundungsraumes verwendet werden 
Die Erfindung betrifft femer em Verfahren zur Datenverarbeitung, das auf einer 
Datenverarbeitungseinrichtung ablauffc, fur die AbbUdung von zu verarbeitenden 
Datenobjekten auf Distanzobjekte, bei dem: zu verarbeitende Datenobjekte einge- 
geben werden, Distanzen zwischen den zu verarbeitenden Datenobjekten als Di- 
stanzobjekte berechnet werden, diese Distanzobjekte als Ausgabedaten ausgege- 
b^ werden, dadurch gekennzeichnet, dafi die Distanzen durch statistische Lem- 
verfahren, lokale Modelle, Verfahren der schUefienden Statistik, und/oder durch ei- 
/> speziellen Berechnungsverfahren berechnet werden: Levenstein- 

MaB, Mutual Information, KuUback-Leibler-Divergenz, in der Signalverarbeitung 
insbesondere fiir Biosignale, eingesetzte Koharenzmafie, LPC cepstral distance, Be- 
re<±nungsverfaliren, die Leistungsspektren zweier Signale in Beziehung setzen wie 
z. B. die Itakura^Saito-Distanz, die MahaJanobis-Distanz und/oder Berechnungs- 
verfe^en un Hinblick auf die Phasensynchronisation von Oszillatoren. SchliefiUch 
betnfft die Erfindung ein Verfahren zur Datenverarbeitung, das auf einer Daten- 
verarbeitungsemrichtung ablauft, fiir die Bestimmung der Clustervaliditat, bei dem 
Datenobjekte eingegeben werden, Distanzobjekte zwischen diesen Datenobjekten 
emgegeben und/oder berechnet werden, sowie eine Zuordnung der zu verarbeiten- 
den Datenobjekte zu Gruppen emgegeben und/oder berechnet wird, msbesondere 
S^.®""®^ Verfahren nach einem der Anspruche 1 bis 5, und ein Mafi fiir die Qua- 
Mat diesCT Zuordnung als Ausgabedaten ausgegeben wird, dadurch gekennzeichnet, 
dafi das Mafi fiir die QualitSt der Zuordnung unter Verwendung von wenigstens ei- 
^^^i^"" emgegebenen und/oder berechneten Distanzobjekte berechnet wird 
Die Erfindung betrifffc ebenfalls zugehorige Datenverarbeitungseinrichtungen und 
Computerprogrammprodukte. 
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